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VOORWOORD 


In dit boek wordt de kernactiviteit van het programmeren behan- 
deld: het ontwerpen van algoritmen en de daarbij benodigde data- 
structuren. Het kan gezien worden als een vervolg op het boek: 
“Programmeren: het ontwerpen van algoritmen", In dit laatste boek 
staan het ontwerpen van algoritmen en de daarbij behorende cor- 
rectheidsbeschouwingen centraal. Het construeren van algoritmen 
en het aantonen van de correctheid van deze algoritmen gaan hand 
in hand; de datastructuren spelen daarbij een ondergeschikte rol. 
Een groot deel van het onderhavige boek is juist gewijd aan het 
gebruik van datastructuren ten behoeve van het ontwerp van algo- 
ritmen. Er wordt vanuit gegaan dat de lezer het ontwerpen van 
eenvoudige algoritmen - op de hierboven bedoelde wijze - meester 
is. Het boek begint met een korte behandeling van deze wijze van 
programmeren om de lezer in staat te stellen het boek te kunnen 
gebruiken onafhankelijk van het hierboven genoemde boek. 


Het boek bestaat uit elf hoofdstukken die ondergebracht zijn in 
drie delen. 

Deel 0 bestaat uit één hoofdstuk (hoofdstuk 0). Dit deel behan- 
delt het programmeren waarbij uitspraken (relaties) en hun trans- 
formaties gebruikt worden voor het construeren van algoritmen. 

Het begrip invariante relatie speelt hierbij een zeer belangrijke rol. 

Deel 1, dat uit vier hoofdstukken bestaat, begint met een behan- 
deling van procedurele abstractie door middel van procedures en 
functies in hoofdstuk 1. Voor zover dat mogelijk is, wordt gebruik 
gemaakt van de programmeertaal Pascal. Er worden echter ook 
andere abstracties getoond dan die, welke in Pascal mogelijk zijn. 
Toepassing van deze abstracties gebeurt op een aantal plaatsen in 
het boek. 

Het tweede hoofdstuk behandelt een aantal variaties op het thema 
backtracking. Het verlicht het werk van de programmeur als hij/zij 
een aantal sjablonen van algoritmen (en datastructuren) kent voor 
bepaalde klassen van problemen. Een belangrijk voorbeeld hiervan 
is backtracking. Aansluitend hierop wordt in hoofdstuk 3 gesproken 
over de efficiëntie van algoritmen, waarbij het er om gaat verschil- 
lende algoritmen voor een zelfde probleem te kunnen vergelijken. 
Een voorbeeld hiervan wordt gegeven in hoofdstuk 4, waar het gaat 
om sorteren. Voor het sorteerprobleem zijn zeer veel algoritmen 
bekend. Het hoofdstuk grijpt ook terug op hoofdstuk 1. 
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Deel 2 staat in het teken van de data-abstractie. Eerst wordt in 
hoofdstuk 5 de typering van Pascal behandeld en in hoofdstuk 6 
een inleiding tot abstracte datatypen en abstracte datastructuren. 
Daarbij wordt onderscheid gemaakt tussen de specificatie (het vast- 
leggen van de eigenschappen), het gebruik in algoritmen, en de 
implementatie van de abstractie, Voor de notatie wordt gebruik 
gemaakt van een MODULA-2-achtige taal. Er wordt niet met 
MODULA-2 zelf gewerkt om niet geconfronteerd te worden met 
eigenschappen van de taal die voor ons onderwerp niet relevant 
zijn. De geïntroduceerde wijze van data-abstractie wordt in de vol- 
gende hoofdstukken gebruikt voor het realiseren van verzamelingen, 
rijen, recursieve structuren en grafen, als objeeten waarmee in 
algoritmen gemanipuleerd kan worden. 

Voor een eerste introductie in het gebruik van abstracte data- 
typen en -structuren zijn de hoofdstukken 7 en 8 zeker voldoende. 
Het zal duidelijk zijn dat hetgeen in deze hoofdstukken gebeurt niet 
in een taal als Pascal mogelijk is. Dit geldt zeker ook voor hoofd- 
stuk 9. Hierin wordt een extra abstractie (en een extra notatie) 
ingevoerd voor recursieve datastructuren. Alhoewel met deze recur- 
sie een aantal datastructuren elegant kan worden beschreven, zou 
dit hoofdstuk voor een ‘elementaire cursus! kunnen worden overge- 
slagen. Dit zelfde geldt voor hoofdstuk 10 dat bedoeld is als een 
kennismaking met grafen in algoritmen, hun beschrijving en hun 
representatie. 


Wij danken iedereen die direct of indirect aan het ontstaan van dit 
boek een bijdrage heeft geleverd. Dit geldt dan met name voor een 
aantal oud-collega's van ons van de Technische Hogeschool te 
Eindhoven. Zo hebben we dankbaar gebruik gemaakt van werk van 
de heren dr.ir. C. Hemerik en drs. R. Mak. De heren dr. F. Peters 
en ir. G. Schoenmakers hebben waardevolle opmerkingen gemaakt 
over een eerdere versie van deze tekst. Het gebruik van het boek 
in de CSO-cursus bij Philips heeft geleid tot talrijke suggesties 
voor verbeteringen. Met name willen we hier noemen de heren 

ir. C. Lepoeter en ir. G.H. in 't Veld. Maar ook de cursisten dan- 
ken wij voor hun opmerkingen. Deze opmerkingen en suggesties 
zijn zo veel mogelijk verwerkt. Wat er nu aan tekst voor u ligt is 
natuurlijk voor onze verantwoordelijkheid. Eventuele op- en aan- 
merkingen horen wij graag van de lezers. Wij willen ook mevrouw 
E. Baselmans-Weijers bedanken. Niet alleen voor het op zo'n fraaie 
wijze verzorgen van de tekst, maar ook voor de uniformiteit die zij 
erin heeft gebracht ten aanzien van notatie en lay-out. 


Eindhoven 
Maarheeze mei 1986 
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0 INLEIDING 


Een programmeerprobleem wordt gekarakteriseerd door een begin- 
toestand, de gegevens zijn bekend, en door een eindtoestand, het 
resultaat is bekend. Het is de bedoeling een proces te beschrijven 
dat - bij uitvoering - een toestandstransformatie realiseert zó dat 
(in een aantal stappen) de begintoestand wordt omgezet in de eind- 
toestand. Zo'n procesbeschrijving wordt in het algemeen een algo- 
ritme genoemd, een handelingsvoorschrift, Een algoritme is een 
samenstel van opdrachten, regels, dat bij uitvoering het gewenste 
effect realiseert. Voorbeelden van algoritmen uit het dagelijkse leven 
zijn welbekend: breipatronen, montagevoorschriften, kookrecepten, 
enzovoort. Een programma is een algoritme uitgedrukt in een pro- 
grammeertaal. De opdrachten worden hier beschreven door middel 
van zogenaamde statements. 

Een algoritme beschrijft in het algemeen niet één enkel proces, 
maar een klasse van processen. De processen in zo'n klasse zijn wel 
alle van dezelfde aard, van dezelfde structuur, maar omdat ze afhan- 
kelijk zijn van de begintoestand zullen ze toch verschillen. Het algo- 
ritme dat voorschrijft hoe een vermenigvuldiging van twee getallen 
uit te voeren zal bij toepassing op twee getallen onder de 10 een 
ander proces opleveren dan bij toepassing op twee getallen boven de 
1000; de aard en structuur van beide processen zijn dezelfde, maar 
het aantal operaties (bijvoorbeeld vermenigvuldiging van twee cijfers) 
is in het ene geval kleiner dan in het andere geval, en de voortgang 
(soms een cijfer '‘onthouden', soms niet) zal ook verschillend zijn. 

Kortom, een algoritme beschrijft een klasse van processen die 
een zelfde soort toestandstransformatie realiseren; deze soort toe- 
standstransformatie wordt de (functionele) specificatie van het algo- 
ritme genoemd. De specificatie zal het effect moeten beschrijven voor 
de gehele klasse van processen; dus voor alle mogelijke begintoe- 
standen zal aangegeven moeten worden wat het eindresultaat is. 
Deze algemeenheid van een algoritme wordt bereikt door de specifi- 
catie uit te drukken in uitspraken, predicaten, condities, over de 
begin- en eindtoestand waarbij een toestand gekarakteriseerd wordt 
door (de waarde van) variabelen. De beginconditie is een uitspraak 
over de gegeven waarden van variabelen, de eindeonditie is een uit- 
spraak over de te realiseren waarden van variabelen. Het programma 
moet - bij uitvoering - realiseren dat, uitgaande van een begintoe- 
stand waarvoor de beginconditie geldt, een eindtoestand bereikt 
wordt waarvoor de eindeonditie geldt. 


Inleiding 3 


Voorbeeld 


Kv OA Yer 
S 
{g = ggd(x,y)} 


is de specificatie van een programma S dat de volgende toestands- 
transformatie moet realiseren: 


gegeven de variabelen x en y, beide met een positieve waarde, 
zal aan de variabele g de waarde van ggd(x,y) toegekend moeten 
worden. 3 


Het effect van een programma wordt dus uitgedrukt door middel van 
de functionele specificatie, bestaande uit de beginconditie en de 
eindconditie. Het programma zal bestaan uit een rij (samenstellingen 
van) statements, elk met hun eigen effect, zó dat ze tezamen voldoen 
aan de specificatie. Bij het ontwerpen van een programma zal de 
specificatie natuurlijk de leidraad vormen. De keuze voor een speci- 
fieke statement op een zekere plaats wordt bepaald door het effect 
van die statement, bezien tegen de bijdrage daarvan aan het totale 
effect dat gerealiseerd moet worden. Met andere woorden: het effect 
van een statement in een programma zal moeten bijdragen aan de 
realisering van het effect van alle statements tezamen, zó dat dat 
totale effect overeenkomt met de functionele specificatie. 

Het effect van een statement, en van een samenstelling van state- 
ments, wordt vanzelfsprekend uitgedrukt door middel van een begin- 
en een eindconditie. Het effect van een statement S, uitgedrukt met 
behulp van beginconditie P en eindeonditie Q, genoteerd als 
{P} s {Q} is: 


wil ná uitvoering van S de conditie Q gelden, dan moet vóór 
uitvoering conditie P gelden. 


Indien we voor alle mogelijke vormen van statements, en voor alle 
mogelijke methoden van samenstelling, een algemene regel geven voor 
het effect, de zogenaamde semantiekregels, kunnen we voor elke 
specifieke statement /samenstelling een uitspraak doen over het effect 
ervan. 

Natuurlijk gelden de volgende regels: 


<- als P' > P en {P} s {Q}, dan {P'} s {0} 
- als Q>Q' en {P} s {Q}, dan {P} s {Q'} 


Voor de assignment statement geldt: 


jee, Vv s= E {Q} 


Wil ná de assignment statement de conditie Q gelden, dan zal vóór 
uitvoering de uitspraak Q met daarin voor elk voorkomen van v de 
expressie E(v) gesubstitueerd, moeten gelden. 
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Voorbeelden 


erniet x ze 3 {x = 3} 
tts 3} x rs t2 (x e 5} 
{nfac = (i-1)!} nfac := nfac +» i {nfac = är} © 


Voor de concatenatie, de sequentiële samenstelling, van statements 
geldt: 


als {P} s1 {Q} en {Q} s2 {R} dan {P} s1; s2 {R} 


Als bekend is dat R geldt na S2 als vooraf Q geldt, en dat Q geldt 
na Sl als vooraf P geldt, dan zal R gelden ná uitvoering van S1; S2 
mits vóór uitvoering P geldt. 


Voorbeelden 


3; x := x+2 {x = 5} 
i is i+1)-nñnfac := nfac wi {nfac = il} ® 


Deze regel wordt vaak als volgt gebruikt: 


wil {P} s {R} gelden, en kennen we niet één statement S die hier- 
aan voldoet, dan zoeken we statements S1 en S2 zó dat er een 
conditie Q is waarvoor geldt: {P} s1 {Q} en {Q9} s2 {R}, zodat 
TPI Sie B2 ART, 


Voor de selectie geldt: 


als {P A B} s1 {Q} en (P A =B} s2 {Q} dan 
{P} if B then Sl else S2 {Q} 


Als Q geldt na Sl als vooraf P a B geldt, én als Q geldt na S2 als 
vooraf P a ~B geldt, zal Q gelden na afloop van if B then S1 else S2 
mits vooraf P geldt. 


Voorbeeld 
omdat {x z2 y} mese x {mE Y Am =x) 
en x < y} m DER PMA Mee y} 
geldt. {true} if x 2 y then m := xelsem:=y 
{(m 2 YAme=x) Vv (m>xAm=y) , dus m = max(x,y)} kd 


Voor de conditionele statement geldt: 
als {P A B} s {Q} en PA rpm 0 dan (PF if B then S {0} 
Als Q geldt na S als vooraf P A B geldt, en als P a 7B een sterkere 


uitspraak is dan Q (dat wil zeggen als P a =B geldt, geldt Q) dan 
geldt Q na afloop van if B then S als vóór uitvoering P geldt. 
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Voorbeeld 
omdat x=XÄx2z2 0 »x = abs(X) 
en {x = X AX <0} x := -x {x = abs(X)} 
geldt {x = X} if x < 0 then x := -x {x = abs(X)} è 


Voor de repetitie geldt: 


als {P AB} s {P} dan geldt {P} while B do S {P A —B} 
mits de repetitie eindigt. 


Als P geldt ná S als vooraf P ^a B geldt zal na afloop van de repetitie 
P A =B gelden als vooraf P geldt. P wordt de invariante relatie (of 

kortweg invariant) van de repetitie genoemd. B wordt variante rela- 
tie genoemd en —B het stopcriterium. De eis dat de repetitie eindigt 
komt erop neer dat na een eindig aantal (2 0) slagen van de repetitie 
„B geldt. 


Voorbeeld 
omdat: {nfac sil AO Sda :S-n-A dS nb} 
i := ž+*1; nfat e= nfac > i 
{Infact = U KOS 1 sm} 
geldt {nfac = il AOS isn 
while i < n do begin i := 1+1; 
B: nfac := nfac «* i 
end 


intao Sit AQ Ss d:Sen A ian, dus hiace = ni} 


want de repetitie eindigt (invariant is 0 < i <n, elke slag neemt i 
met 1 toe, i wordt dus op een bepaald moment gelijk aan n (impliciet 
geldt n 20)). 


Deze regels zullen een leidraad vormen bij het ontwerpen van een 
programma voor een bepaald probleem, zeg met beginconditie G en 
eindeonditie R. Over het algemeen zal zo'n probleem alleen met een 
repetitie op te lossen zijn. We gaan dan als volgt te werk. 

Als we een P en een B kunnen vinden zó dat P a ~ B >R, zal de 
structuur van het programma moeten worden: 


{G} 
SI} 
{P} 
while B do S2 


[P A — B, dus R} 


Vervolgens moeten we statements (of samenstellingen van statements) 
Sl en S2 vinden zodat geldt: 
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{GG} s1 {P} dat wil zeggen uitgaande van de begintoe- 
stand moet een toestand gerealiseerd worden 
waarin de invariant P geldt, de zogenaamde 
initialisatie. 

{P A B} s2 {P} waarbij S2 tevens (op den duur) voor eindi- 
ging van de repetitie moet zorgen. 


Als dat alles lukt vinden we een correcte oplossing voor het program- 
meerprobleem volgens de eerder gegeven semantiekregels. Het grote 
belang van de regel voor de repetitie, met behulp van een invariant 
en een variant, is dat slechts één keer iets bewezen hoeft te worden 
over S2, namelijk {P A B} s2 {P}, onafhankelijk van het aantal malen 
dat S2 uitgevoerd zal worden. 

Bij elke repetitie moet gegarandeerd worden dat de repetitie ein- 
digt! Vaak gebeurt dat door een variante functie te kiezen, in boven- 
staand voorbeeld bijvoorbeeld n-i, die naar beneden begrensd is, 
hier 2 0, en waarvan de waarde elke slag van de repetitie afneemt. 


Voor het berekenen van n! voor gegeven waarde van n (2 0) hebben 
we ondertussen het programma grotendeels ontworpen. Het volledige 
programma is: 


ine 0} 

1 sere nfacif* f} 

Finy.: nfac = BA OS La nt 
while i < n do begin 4 :* i+}? 


nfac «= nfac * a 
end 
{nfac'= il: KNO Si Sia EA dus nfac = nt} 


Als variante functie voldoet hier n-i. 


Voorbeeld 
Gevraagd voor het probleem 
Em tan SVA WP rr >u) 


S 
{g 


ggd(x,Y)} 
een programma te ontwerpen. 

Als eigenschappen van de grootste gemene deler (voor positieve 
getallen) kennen we: 


ggd(a,a) =a (1) 
als a > b dan ggd(a,b) = ggd(a-b,b) (2) 


We gebruiken (1) bij 
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{ggd(x,y) = ggd(X,Y) Ax > O0 Ay o> OAR y} 


gm 
{g = ggd(X,Y) } 
zodat we nog moeten realiseren: 


RSL AV BN ARO Ay} 
S1 
{ggd(x,‚y) = ggqdlX,Y) Ax >OAYyY?>O0Ax=y} 


S1 zal de waarden van x en y moeten manipuleren zó dat ggd(x,y) 
gelijk aan ggd(X,Y) blijft, dat x > 0 en y > 0 blijft, en dat x = y 
gaat gelden. We gebruiken een repetitie met ggd(x,‚y) = ggd(X,Y) A 
x> 0 A y > 0 als invariant P (die initieel direct al geldt!) en x = y 
als stopcriterium. De structuur van S1 wordt dan: 


RS KART TAR SOA Y 2:00, Aus 

ggd(x,y) = ggd(X,Y) Ax > OQA yi> 0} 

while x <> y do begin S2 end 

{ggd(x,y) = ggd(X,Y) Ax > OAy>O0Ax=y} 


S2 moet aan twee eisen voldoen: 


{P Ax #y} s2 {Pp} 
én S2 moet op den duur eindiging van de repetitie bewerkstelligen. 


We kunnen nu eigenschap (2) gebruiken. Omdat, als S2 wordt uitge- 
voerd, geldt x # y, dus x < y v Xx > y, kunnen we P invariant hou- 
den met: 


{P Ax # y} 
if x < y then y :=y=-x else x := x-y 


{P} 


en omdat elke slag de grootste van x en y kleiner wordt, zal eindi- 
ging gegarandeerd zijn (variante functie x+y). 
Het totale programma is dus: 


er MAY YARSOAY > 0} 
(iný. P; ggd(x,y) = ggd(X,Y) Ax > OA y> 0} 
while x <> y do 


begin if x < y then y := y-X 
Fe else x := x-y 
end; 
{P A x = y} 
g := X 
{g = ggd(X,Y) } 
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CONDITIES 


Condities (predicaten, uitspraken, asserties) zijn functies die in elk 
punt van de toestandsruimte, dat wil zeggen in elke mogelijke toestand, 
de waarde true of false hebben. We definiëren ze hier informeel - en 
voor zover we ze nodig hebben - en introduceren tevens de notatie. 


- true is een conditie (in elk punt van de toestandsruimte true); 

- false is een conditie (in elk punt van de toestandsruimte false); 

- expressies waarin programmavariabelen voorkomen en waaraan, 
afhankelijk van de waarde(n) van de variabelen, de waarde true 
of false toegekend kan worden, zijn condities; bijvoorbeeld x = 3, 
x? +y? > 8, a is een priemgetal; 

- als P en Q condities zijn, dan ook SP, PaA Q, P vQ en (P); de 
haakjes gebruiken we om de prioriteit van de operatoren aan te 
geven. 


Een conditie P heet sterker dan een conditie Q, notatie P > Q, als 
overal waar P de waarde true heeft (waar is) Q ook de waarde true 
heeft; Q heet dan zwakker dan P. Als P= Q èn Q= P dan hebben P 
en Q in elk punt dezelfde waarde; we noteren dit als P = Q. 

False is sterker dan elke conditie en true is zwakker dan elke 
conditie. 


Enkele eigenschappen: 


P a false = false P v false = P 

P A true =P P v true = true 

PA “aP = false Pv aP = true 

PA (QAR) =(PAGQ) AR Pv (QvR)=(PvQ) vR 
PaA(QVvVR)=(PAQ) v(PAR) Pv (QaAR) =(PvQ) ALP vR) 
“ALPA Q) 2 aP yng P VOF SPA Q 

PA Q>=>P PeP vQ 


We kunnen condities ook samenstellen met behulp van quantoren. We 
kennen de ‘voor alle'-quantor (A) en de 'er is een'-quantor (E). De 
notatie is: 


CARD IP) 
CRE se P) 
x wordt dummy (gebonden variabele) genoemd, de conditie D is het 


domein en P is de gequantificeerde conditie. 
De betekenis: 


Ax e D: R) 'voor alle x in het domein D (waarvoor D 
waar is) is P waar', 
(Ex : D : P) = 'er is een x in het domein D (waarvoor D 


waar is) waarvoor P waar is'. 
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Bijvoorbeeld: 


(Ai : 0 sik< 10 : iis een kwadraat) 
Fe: = (0 is een kwadraat) 
A (1 is een kwadraat) 


AÀ « 


A 


9 is een kwadraat) 


= false, 


(Ei : 0 <si< 10 : iis een kwadraat) 


Ws Ge i. 


( 
t 
Enkele eigenschappen: 


(Ax : false : P) = true 
(Ax : D : true) = true 
IAK DT QI LEX : D 


(0 is een kwadraat) 
(1 is een kwadraat) 


9 is een kwadraat) 
rue. 


(Ex : false : P) = false 
(Ex : D : false) = false 


TQ MEK: D: QAD: ag) 


We zullen ook gequantificeerde expressies gebruiken: 


EN SDR) 


(Sx : D : E(x)) 


(MIN x : D : E(x)) 


(MAX x: D : E(x)) 


met D en P condities, staat voor het 
aantal elementen van het domein D waar- 
voor P waar is; bijvoorbeeld: 

(Ni : 0 si<5 : iis een kwadraat) = 3. 


met D een conditie en E(x) een expressie, 
staat voor de som van de expressies E(x) 
voor alle x in het domein D; bijvoorbeeld: 
(Bir Date r Del 


staat voor de minimale waarde van E(x) 
over alle elementen van het domein D; 
bijvoorbeeld: (MIN i : 0 si<5:i) =0. 


staat voor de maximale waarde van E(x) 
over alle elementen van het domein D; 
bijvoorbeeld: (MAX i:0 si<5:i2) = 16. 


DEEL 1 


1 PROCEDURES EN FUNCTIES 


1.1 INLEIDING 


Een programmeertaal - zoals Pascal - biedt mogelijkheden om een pro- 
ces te beschrijven. Een proces is een toestandstransformatie, dat 
wil zeggen de berekening van waarden van uitvoervariabelen uit 
invoerwaarden volgens een gegeven specificatie (het programmeer- 
probleem). Een programma beschrijft een proces (actie) door een 
reeks assignment statements (beschrijvingen van de elementaire 
actie: waardetoekenning), geordend met behulp van de besturings- 
structuren concatenatie, selectie /conditie en repetitie. Over het 
algemeen is een proces te beschouwen als bestaande uit deelproces- 
sen, die eventueel weer uit deelprocessen zijn opgebouwd, etcetera, 
totdat een proces niet meer te splitsen is in delen (en dus elementair 
is). De beschrijving van een deelproces is in feite niets anders dan 
een uitbreiding van het actie-repertoire. Als zo'n beschrijving in 
een programma ‘aangeroepen! kan worden ontstaat de mogelijkheid om 
- naast elementaire acties - ook ‘hogere! acties te beschrijven. Deze 
vorm van abstractie wordt het procedure-mechanisme genoemd. De 
beschrijving van een (deel)proces heet procedure (declaratie) en dat 
proces kan geactiveerd worden door de procedure aan te roepen. 
Een procedure beschrijft een hele klasse van processen: voor een 
verzameling mogelijke invoerwaarden de berekening van de waarden 
van uitvoervariabelen volgens een bepaalde specificatie van het 
effect. Wordt een procedure verschillende malen aangeroepen met 
verschillende invoerwaarden dan zullen in het algemeen verschillende 
processen uitgevoerd worden die, wel alle volgens hetzelfde patroon 
door het gegeven voorschrift, verschillende waarden voor de uitvoer- 
variabelen opleveren. Het procedure-mechanisme biedt: 


- de mogelijkheid een programmeerprobleem op te lossen in termen 
van acties/processen die aansluiten bij de betreffende toepassing; 

- daardoor de mogelijkheid betere en meer overzichtelijke pro- 
gramma's te schrijven; 

- de mogelijkheid de beschrijving van veelgebruikte (deel)processen 
in een 'bibliotheek' op te nemen zodat ze voor gebruikers direct 
beschikbaar zijn; 

- aansluiting bij methoden als top-down ontwerp en stepwise refine- 
ment. 
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Waarden worden elementair uitgedrukt door expressies opgebouwd 
uit constanten, variabelen, operatoren en (standaard) functies. Een 
uitbreiding hiervan vormt het functie-mechanisme, dat op zich als 
een variant van het procedure-mechanisme te beschouwen is. Een 
functie is de beschrijving van een proces dat een waarde berekent 
volgens een voor die functie specifieke (reeks) operatie(s). Een aan- 
roep van de functie zal voor een argument (invoerwaarde) dus een 
uitvoerwaarde opleveren die voldoet aan een bepaalde specificatie. 
Aldus ontstaat de mogelijkheid in een programma ingewikkelder ope- 
raties /waardeberekeningen als functie te beschrijven en aan te roe- 
pen, alsook de mogelijkheid om met operaties op niet-standaard data- 
structuren als functie om te gaan. 


1.2 PROCEDURES 


Een procedure is de beschrijving van een deelproces. Een activering 
van de procedure vindt plaats door middel van de uitvoering van een 
'aanroep', de procedure statement. Op het moment van aanroep is 
het effect van het proces interessant, de toestandstransformatie die 
erdoor gerealiseerd wordt. Op zo'n moment van de aanroep is het 
niet van belang hóe het proces dat effect realiseert; dat is belang- 
rijk bij de proceduredeclaratie, de betreffende procesbeschrijving 
waar het effect gerealiseerd en vastgelegd moet worden. Bij de 
declaratie van een procedure wordt dus een specificatie van het 
effect aangegeven, en de programmatekst van de procedure die 
daaraan moet voldoen; bij aanroep van de procedure kan die speci- 
ficatie gebruikt worden om de toestandstransformatie te kennen. 

De specificatie van het effect van een procedure leggen we vast 
in een preconditie en een postconditie. Deze leggen een verband 
tussen de invoerwaarden en de waarden van de uitvoervariabelen. 
Bij de declaratie van een procedure worden de invoerwaarden en 
uitvoervariabelen aangeduid met namen die in de rest van het pro- 
gramma geen betekenis hebben: de formele parameters. Op het 
moment van aanroep worden de waarden en variabelen genoemd die, 
voor die activering, van belang zijn: de actuele parameters. De spe- 
cificatie van het effect zal bij declaratie dus uitgedrukt worden in 
de formele parameters, en een semantiekregel voor de procedure 
statement zal moeten weergeven hoe het effect van een aanroep in 
actuele parameters uitgedrukt kan worden. 


Als voorbeeld van een proceduredeclaratie een procedure die de 

grootste gemene deler bepaalt van twee positieve gehele getallen, 
aangeduid met a en b, en het resultaat toekent aan een variabele 
aangeduid met c. Formele parameters zijn hier dus a, b en c; de 
naam van de procedure is ggd. 
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procedure ggd(var c: integer; a,b: integer); 
{pre: a > Ons > Oj 
post: c = GGD(a,b)} 
var r: integer; 
begin {a.= AA be=Baa>0aAb > 0} 


ifa: s bsthen began rss Rs oai Db se rend; 
r := a mod b; 
{inv.: GGD(a,b) = GGD(A,B) A a 2 b Ar = a mod b} 
while r <> 0 do 
begin a := b; bÞz= r; r :=:à: mod. b end; 
{GGD (a,b) = GGD(A,B) A a mod b = 0 Aa 2 b} 
Cc s= b 
{c = GGD(A,B) } 


end 


Als voorbeeld van een procedure statement de aanroep van ggd, met 
als actuele parameters de variabele g en de expressies x en y met 
daarbij de effectbeschrijving: 


(x = Xx A Val ggd(g,x,y) 1g = GED(x,y) A X = XO A vet 


De declaratie van een procedure vindt (in Pascal) plaats bij de andere 
declaraties van een programma, dus vóór de statements. Een proce- 
dure statement kan staan op elke plaats in het programma waar een 
statement in het algemeen is toegestaan, ná de plaats van de declara- 
tie. 


PROCEDUREDECLARATIE 
In de proceduredeclaratie moeten worden vastgelegd: 


- de naam van de procedure; 

- de formele parameters, hun type en de rol die zij spelen: invoer- 
waarde of uitvoervariabele (voorvoegsel var); 

- de body van de procedure: de procesbeschrijving; 


Het effect van de procedure moet vastgelegd worden in een stuk 
documentatie: een pre- en een posteonditie die het effect uitdrukken 
door middel van uitspraken over de formele parameters. 


Voorbeeld 


procedure kwadsom(var s: integer; m,n: integer); 
Dre: M S f? Ar a 
pest: A ea Te LEN se ke} 
var p: integer; 
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begin {m < n} 
Dren) S sep * py 
{inv.: s= {Sirt ki spri) Ams piian) 
while p <> n do 
begin p := p+1; S :=S +p *p end 
a E U EE E ES 
end 


De naam van de procedure is kwadsom, de formele parameters zijn s 

(uitvoervariabele) en m en n (invoerwaarden), en de procesbeschrij- 
ving - die gebruik maakt van een eigen (lokale) variabele p - wordt 

gevormd door de laatste 7 regels. Het effect is met pre- en postcon- 
ditie tussen accoladen vermeld. 


Een formele parameter die voor een uitvoervariabele staat (vergelijk 
x in de assignment statement x := y+1) zal in de proceduredeclaratie 
voorzien worden van de aanduiding var. Dit zal ook gelden voor 
parameters die een tweeledige rol spelen: zowel invoerwaarde als 
uitvoervariabele (vergelijk x in x := x+2). Bij een formele parameter 
die alleen voor een invoerwaarde staat (vergelijk x in y := x+3) ont- 
breekt in de declaratie de aanduiding var. 

Bij iedere proceduredeclaratie behoort een effectbeschrijving in 
de vorm van een preconditie en een postconditie: uitspraken over de 
formele parameters. Stel dat de volgende procedure is gedeclareerd 
zonder effectbeschrijving: 


procedure vkw(var x1,x2: real; a,b,c: real); 
var d: real; 
begin d := sqrt(b *b -4+»+a +c); 
(-b-d)/(2 +a); 
(-b+d)/(2 * a) 


xi 
x2 
end 


Bij gebruik van de procedure zal een gebruiker, die slechts geinte- 
resseerd zal zijn in het effect en niet in de procesbeschrijving, 
waarschijnlijk niet attent zijn op mogelijke foutieve aanroepen zoals 
bijvoorbeeld vkw(x,y,0,2,4) en vkw(s,t,4,2,4). Voor een correct 
gebruik is het nodig de preconditie (hier: a 0 A b? - 4ac 20) en 
de postconditie (hier: a(x-x1)(x-x2) = ax? + bx +c) te kennen. 
Deze zullen dus bij de declaratie expliciet vermeld moeten worden. 


N.B. Voor een correct gebruik is het ook nodig dat de actuele var- 
parameters verschillend zijn. Een aanroep vkw(x,x,1,0,-1) 
zal niet een resultaat opleveren dat voldoet aan de postcondi- 
tie. We komen hier later op terug. 


Aldus kan het effect van een procedure(declaratie) geheel vastgelegd 
worden door de heading van de procedure tezamen met de pre- en 
postconditie: 
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procedure vkw(var xl,x2: real; a,b,c: real); 
{pre: a #0 A b? - 4ac 2 0; 
post: a(x-x1) (x-x2) = ax? + bx +c} 


In pre- en postconditie komen alleen formele parameters voor. Lokale 
variabelen van de procedure spelen natuurlijk geen rol: het zijn 
slechts hulpvariabelen voor de procesbeschrijving. In Pascal, en in 
vele andere programmeertalen, mogen in de procedurebody naast de 
formele parameters en de lokale variabelen ook zogenaamde globale 
variabelen voorkomen; dat zijn variabelen van bct programma waar- 
binnen de procedure gedeclareerd is. Als globale variabelen gebruikt 
worden zullen deze ook in de pre- en/of postconditie voorkomen. Om 
het effect van een procedure te kunnen beschrijven los van het 
omvattende programma, zullen we geen globale variabelen gebruiken. 
Met andere woorden: de eventuele neiging tot het gebruik van glo- 
bale variabelen onderdrukken we door ze als formele parameter op te 
nemen ! 

In de body van de procedure zullen - zoals in elk stuk program- 
ma - vanzelfsprekend asserties voorkomen, zoals invarianten van 
repetities en dergelijke. De algemene vorm van een proceduredecla- 
ratie zal zijn: 


procedure p(F); 
pre: P(F) 
post: Q(F) } 
‘declaratie lokale variabelen'; 
begin {P} 
'statements' 


{Q} 


end 


waarbij p staat voor de naam van de procedure, F staat voor de col- 
lectie formele parameters, en waar de 'statements' zodanig moeten 
zijn dat, indien vóór uitvoering P geldt, ná uitvoering Q geldt. 


Voorbeeld 


procedure fac (var nfac: integer; n: integer); 
{pre: n 2 0 
post: nfac = nl} 
var i: integer; 
begin {n 2 0} 
i := 0; nfac := 1; {inv.: nfac = il} 
while i <> n do 
begin {nfac = il! A i < n} 
| ir= TE nfac te nfat *`i 
{nfac = it} 


end 
{nfad sitte A} 
end 
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PROCEDURE STATEMENT 


In een procedure statement moeten altijd de volgende drie componen- 
ten aanwezig zijn: 


- de identificatie, de naam, van de procedure: om aan te geven 
wélke procedure geactiveerd wordt, wélke actie plaatsvindt; 

- de invoerwaarden: de operanden waarop door de procedure 
geopereerd wordt en die de begintoestand vastleggen; 

- de uitvoervariabelen: de variabelen waar na afloop van de actie 
de resultaatwaarden terug te vinden zijn. 


De procedure statement wordt als volgt genoteerd: de naam van de 
procedure gevolgd door - tussen haakjes en onderling gescheiden 
door komma's - de uitvoervariabelen en invoerwaarden, tezamen de 
actuele parameters genoemd. De algemene vorm van een invoerwaarde 
is een expressie (van het voorgeschreven type!), van een uitvoer- 
variabele vanzelfsprekend een variabele. De rij actuele parameters 
moet passen bij de rij formele parameters, dat wil zeggen de twee 
rijen moeten even lang zijn en per plaats moeten type en rol van de 
parameters overeenkomen. Een procedure statement mag, ná de 
heading van de procedure, overal voorkomen in het programma waar 
een statement mag staan. 


Voorbeelden 


kwadsom(t, 1,100) 
actuele invoerwaarden: (de waarden van de expressies) 1 en 100 
actuele uitvoervariabele: t 


fac(f,‚k) 
actuele invoerwaarde: (de waarde van de expressie) k 
actuele uitvoervariabele: f ® 


Een gedeclareerde procedure kan meermalen door procedure state- 
ments in het programma geactiveerd (aangeroepen) worden. De uit- 
voering van de procedure statement bestaat uit twee fasen : 


(1) De formele invoerparameters worden als het ware in de body 
gedeclareerd als lokale variabele en krijgen als beginwaarde 
de waarde van de overeenkomstige actuele parameters; de 
formele uitvoerparameters worden in de body vervangen door 
de overeenkomende actuele parameters (variabelen). De iden- 
titeit van de actuele parameters wordt op het moment van aan- 
roep vastgesteld. Zo zal bij uitvoering van de procedure 
statement ggd(alil,aljl,alk]) eerst vastgesteld worden welke 
elementen van a in het geding zijn. 

Daarna wordt de aldus gewijzigde body uitgevoerd. 
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Voorbeeld 


Uitvoering van de procedure statement 
ggd(g,x,y) 

leidt tot uitvoering van de procesbeschrijving 
var a,b: integer; 


r: integer; 
begin a := x; b := y} 


if a < b then begin r := àz a := by b := r end; 
r := a mod b; 
while r <> 0 do 
begin a ss þ; bte ira mod b end; 
g := b 
end © 


Het effect van de aanroep van een procedure, van de procedure 
statement, wordt gegeven door de pre- en postconditie van de 
declaratie van de procedure, waarbij de formele parameters zijn 
vervangen door de actuele parameters. Dit is echter niet in alle 
gevallen waar. Dat moge blijken uit de volgende twee voorbeelden: 


procedure verhoog(var b: integer; a: integer); 
pre: true 
post: b = a+1} 
begin b := a+1 end 


Als deze procedure, waarvoor altijd voldaan is aan de preconditie, 
aangeroepen wordt met verhoog(x,x), zal na afloop uiteraard niet 
gelden x = x+1, 

Als de procedure 


procedure swap(var a,b: integer); 
pre: P(a,b) voor willekeurige P 
post: P(b,a)} 


begin a := atb; b := a=b; a := a-b end 


wordt aangeroepen met actuele parameters x en y en een willekeurige 
preconditie P(x,y), dan geldt na afloop de posteonditie P(y,‚x); als 
bijvoorbeeld de preconditie is x = xg A y = y0, dan is de posteonditie 
x = yQ ^ y =x0. Dit zal echter niet gelden voor een aanroep met 
twee dezelfde actuele parameters, bijvoorbeeld swap(x,x); er geldt 
dan altijd dat deze actuele parameter na afloop de waarde 0 heeft. 
Ook bij het voorbeeld van de procedure vkw zagen we reeds proble- 
men bij gelijke actuele parameters optreden. | 

De bovenstaande problemen treden niet op als we ervoor zorgen 
dat de actuele var-parameters verschillend zijn en dat deze variabe- 
len ook niet voorkomen in de actuele value-parameters. We zullen 
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deze eigenschap aangeven met dis(A) als A de lijst is van actuele 
parameters, Na de algemene vorm van declaratie van een procedure, 
zoals vermeld op bladzijde 16, zal de semantiekregel voor aanroep 
van de procedure, p(A), zijn: 


{P(A) A dis(A)} p(A) {Q(A)} 


De eis van disjunctie van actuele parameters is te vergelijken met de 
eis bij de assignmentregel dat de expressie toelaatbaar moet zijn. 
Zoals we dat bij het toepassen van de semantiekregel voor de assign- 
ment niet steeds expliciet vermelden, zullen we dat voor de proce- 
dure statement ook niet steeds doen. Echter, voorzichtigheid is 
geboden! 

Voorbeelden 


Aanroep van de procedure fac met de statement 
fac(f,k) 

heeft als effectbeschrijving 
(k è 0} fac(f/k) {f = kl} 

Aanroep van de procedure swap met de statement 
swap(x,y) 


in een toestand waar geldt x? > y, zal een eindtoestand opleveren 
waar geldt y? > x. e 


Opmerking 


Een procedure heeft niet altijd parameters. De volgende procedure 
zet in de uitvoerrij de kwadraten van de gehele getallen die in de 
invoerrij staan: 


procedure kwad; 
var n: integer; 
begin while not eof do 
begin read(n); write(n *n) end 


end 


Effectvastlegging wordt nu moeilijker. De invoerrij input en de uit- 
voerrij output zijn eigenlijk globale variabelen en het effect zou 

hierin uitgedrukt moeten worden. Om toch zoveel mogelijk informatie 
over het effect te geven zouden pre- en postconditie kunnen luiden: 


pre: Anput = sap; i.a? A (AL : OS isSn: a, geheel) A 
output = <Sinit> 
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post: input =S: XA 
output = <init, aĝ... a> è 


Tot nu toe zagen we alleen parameters van enkelvoudige typen, en 
waren we niet expliciet over de mogelijkheden voor typering van 
(formele) parameters. In het algemeen kunnen we stellen dat bij 
type-aanduiding van formele parameters alle typen mogen voorko- 
men die op de plaats van declaratie van de procedure gedefinieerd 
zijn; dus zowel de standaardtypen als de in het programma gedefini- 
eerde typen. De overeenkomstige actuele parameters bij aanroep van 
de procedure zullen van hetzelfde type (gedeclareerd) moeten zijn. 

Voor array-typen zullen we echter wat liberaler zijn. Allereerst 
om moeilijke - elementaire - vragen te vermijden als: 

zijn na de definitie en declaraties: 


type A: array [0..9] of integer; 
var a: A; 
b: array [0..9] of integer; 


a en b van hetzelfde type of niet? 

Vervolgens om het mogelijk te maken één proceduredeclaratie te 
schrijven die voor verschillende actuele array-grootten gebruikt kan 
worden (wel met hetzelfde effect! ). Bijvoorbeeld een procedure som 
die bij aanroep de ene keer de elementen sommeert van een integer 
array van 10 elementen, maar een andere keer de sommatie van de 
elementen van een array van 100 elementen realiseert. 

Voor array-parameters zullen we toestaan dat in de type-aandui- 
ding een definitie van een array-type voorkomt zonder een concrete 
vastlegging van het domein (conformant arrays). De onder- en 
bovengrens van het domein duiden we aan met twee namen die in 
de body van de procedure dus een betekenis hebben en gebruikt 
mogen worden. Voor elke actuele parameter van een array-type zul- 
len deze namen als waarde hebben de betreffende onder- en boven- 
grens van de actuele array-parameter. 


Voorbeeld 


procedure som(var s: integer; 
a: array [first .. last: integer] of integer); 
{pre: true 


post: a >81 r first Sje last saldi} 
var i: integer; 
begin i := first; s «= "0; 


IA 


{invi sa (84 4 first Bj <1 aat } 
while i S last do 

begin s := stali]; i := i+1 end 
{s = (Sj : first $ j $ last : alj])} 
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Als gedeclareerd zijn: 


var x: array [0..9] of integer; 
var y: array [10..109] of integer; 
var si,s2: integer; 


en als x en y een waarde hebben, geldt voor de procedure state- 
ments: 


F sokia} 
OS ta 0 : ylsi s 


{true} som(s1,x) {s1 = 
{true} som(s2,y) {s2 


iri 
lu | ua 
Kals Kd 
e. O 
IIA 
Ll 
IA 


Zoals de formele parameters verschillende namen hebben, zullen ook 
de namen van onder- en bovengrens van het domein weer uniek 
gekozen moeten worden. Ter illustratie daarvan het voorbeeld van 
matrixvermenigvuldiging. In de preconditie staat aangegeven dat er 
verband bestaat tussen de waarden van enkele grenzen; het is ech- 
ter nodig allemaal verschillende namen te kiezen! 


procedure mv(A: arraylall..alm: integer; a21..a2n: integer] of real; 
B: array[b11..b1n: integer; b21..b2p: integer] of real; 
var C: array[c11..c1m: integer; c21. .C2p: integer] 
hr of real); 

{pre: alm-a11 = cim-c11 A bin-bi1l = a2n-a21 A b2p-b21 = c2p-c21 

post: C = A * B} 

var i,j,k: integer; 

vern: real; 


begin for i := c11 to clm do 
Su Tor j := c21 to c2p do 
— begin som := 0; en 
for k := a21 to a2n do som := som + ali,k] + 
Blk,jl; 
cli,jl := som 
end 
end aren 


Tot slot een voorbeeld van een geheel programma met procedures. In 
de invoerrij staat een geheel getal n (n 2 1). H(n) is gedefinieerd als 


Hi et En. ta IRLA 


Dl 


Het programma plaatst alle partiële sommen van H(n) (dat wil zeggen 
(Sk : 1 <k si: 1/k) voor i= 1,...‚n) in de uitvoerrij als twee 
gehele getallen (de teller en de noemer van een breuk). 
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program harmonisch(input,output) 
var n,i,teller,noemer,hulp: integer; 
procedure ggd(var k: integer; a,b: integer); 
{pre: a,b > 0 
post: k = GGD(a,b) } 
begin while a<> b do 
if a > b then a := a-b else b := b-a; 
ksd 
end; 
procedure telbreukop(var q,r: integer; p: integer); 
{pre: p #0 Aq=dq0Ar=r0 
post: q/r = q0/r0 + 1/p} 


begin q := p*q+r; r := r*p end; 
begin read(n); {n 2 1} 
i z= 1; teller =: 1; noemer :=1; 


writeln(teller,noemer ); 
{inv.: teller/noemer = (Sk: 1 < k < i: 1/k)} 
while i <> n do Sy 
begin i := i+l; 
telbreukop(teller,noemer, i); 
{teller/noemer = (Sk : 1SkSi: 1/k) } 
ggd(hulp,teller,noemer); 
if hulp > 1 then 
begin teller : 
noemer : 


teller div hulp; 
noemer div hulp 


end ; 
{teller/noemer = (Sk : 1SkSi: 1/k) } 
writeln(teller,noemer ) 


1.3 FUNCTIES 


Een functiewaarde zal volgens een bepaalde specificatie afhankelijk 
zijn van de argumenten. In het algemeen (bijvoorbeeld bij wiskun- 
dige functies) drukt die specificatie uit hoe de functiewaarde voor 
een bepaalde reeks argumenten berekend kan worden. De declaratie 
van een functie in een programma zal dan ook bestaan uit de beschrij- 
ving van een proces dat de functiewaarde berekent volgens de voor 
die functie specifieke (reeks) operatie(s), zodat voldaan wordt aan 
de specificatie. De activering van een functie zal een functiewaarde 
(uitvoerwaarde) opleveren passend bij de actuele argumenten (de 
invoerwaarden), en die functiewaarde kan direct in een expressie 
gebruikt worden; de aanroep zal dan ook niet als statement plaats- 
vinden, maar direct in een expressie. 
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Een functie is te beschouwen als een speciaal geval van een pro- 
cedure: één uitvoerresultaat - van het in de declaratie aangegeven 
type - afhankelijk van nul of meer invoerwaarden. Bij een procedure 
voor deze situatie zou één uitvoervariabele gebruikt worden. Bij een 
functie bestaan geen uitvoervariabelen; het resultaat wordt in de 
body aan de naam van de functie toegekend en is dus in de expressie 
waar de aanroep plaatsvindt direct door de aanroep (function desig- 
nator) beschikbaar. 


Voorbeeld 


function facf(n: integer): integer; 
{pre: n 2 0 
post: facf(n) = nl} 
var i,h: integer; 
begin {n 2 0} 


ten Mes 1; (Ww. h =s ll AOS ESA} 
while i<>n do 
begin i = i+1; h := h»+»i end; 
iks ILA i = n} N 
facf := h 
{facf = ni} 


end 
Aanroep: 
x s= facf (6) 


waardoor aan x de waarde 720 (= 6!) wordt toegekend. 2 


FUNCTIEDECLARATIE 


Een functie heeft geen var-parameters; in de heading van de decla- 
ratie moet het type van de resultaatwaarde aangegeven worden (in 
het voorbeeld: integer). 

In de body moet ten minste één maal een waardetoekenning aan 
de naam van de functie plaatsvinden (in het voorbeeld: facf := h). 
Bij elke uitvoering van de body zal na afloop aan de naam van de 
functie een waarde toegekend moeten zijn. 

Voor het overige is alles analoog aan de proceduredeclaratie. De 
algemene vorm van een functiedeclaratie is: 


function f(F): T; 
{pre: P(F) 
post: Q(£(F),F) } 
‘declaratie lokale variabelen'; 
begin {P} 
‘statements ' 


{Q} 


end 
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waarbij F staat voor de collectie formele value-parameters en P(F)en 
Q(É(F),F) uitspraken zijn over de formele parameters en de functie- 
waarde. De 'statements' moeten zodanig zijn dat, indien P vóór 
uitvoering geldt, ná uitvoering Q geldt. 


FUNCTION DESIGNATOR 


De function designator is de aanroep van een functie, direct in een 
expressie. Het effect van de aanroep zal uitgedrukt worden in de 
pre- en posteonditie van de declaratie van de functie, waarbij de 
formele parameters vervangen zijn door de actuele parameters. 
Omdat er geen var-parameters zijn hoeven we nu niet te eisen dat 
de parameters disjunct zijn, wat wel nodig was bij de procedure- 
aanroep (zie bladzijde 19). 

Alle semantiekregels die we tot nu toe zagen beschreven het 
effect van statements. Omdat de functie-aanroep geen statement is 
kunnen we niet zonder meer een zelfde soort semantiekregel voor de 
function designator geven. We geven eerst informeel het effect van 
een functie-aanroep aan, waarna we voor een specifiek geval - de 
assignment aan een variabele - een formele regel definiëren. Bij 
beide sluiten we aan bij de algemene vorm van de functiedeclaratie 
zoals vermeld op de vorige bladzijde. 


Informeel: de aanroep f(A), met A de lijst van actuele parameters, 
levert een waarde op waarvoor geldt Q(f(A),A) als vóór aanroep 
voor de actuele parameters geldt P(A). 


Voorbeeld 


De aanroep facf(6) levert een waarde op waarvoor geldt facf(6) = 6! 
want vooraf geldt 6 2 0; de aanroep facf(12+x) levert een waarde op 
waarvoor geldt facf(12+x) = (12+x)! mits vooraf geldt dat 12+x 2 0, © 


Formeel: voor het gebruik van de function designator in een assign- 
ment geldt: 


{P(A) A Q(£(A),A) A Beke := E(f(A)) {R} 


dat wil zeggen na toekenning aan x van de waarde van een expressie 
waarin een aanroep van f voorkomt zal R gelden, als vooraf geldt 
dat aan P(A) voldaan is (de preconditie) en dat R geldt met (volgens 
de semantiekregel van de assignment statement) daarin x vervangen 
door de expressie waar f(A) in voorkomt, wrs voor f(A) geldt 
wat in Q(f(A),A) staat. 

De gehele preconditie van deze assignment statement zal na ver- 
eenvoudiging, zoals de eliminatie van f(A), bestaan uit een begin- 
voorwaarde voor de actuele parameters en een eis die met R te maken 
heeft. 
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Voorbeeld 


Aanroep van facf in de assignment statement 
x := facf(6) met als posteonditie x > 100 
heeft als effectbeschrijving 


{6 2 O A facf(6) =6! A facf(6) > 100} x := facf(6) {x > 100} 
ofwel 

{true A 6! > 100} x := facf(6) {x > 100} 
ofwel 

{720 > 100} x := facf(6) {x > 100} 
ofwel 


{true} x := facf(6) {x > 100} 


Voorbeeld 


De volgende functie berekent de 'geheeltallige benadering van de 
wortel! van het argument. 


function root(a: integer): integer; 

{pre: a 2 0 

post: root(a)? Sa < (root(a) +1)°} 

var X,yY,Z: integer; 

begin {a 2 0} 
Xx ss 0} y se Ihza 15 
{inv.: x° Sa Ay s= (x+1)? Az = 2x+1} 
while y <= a do 

DORE X se X+; 2 ee 2427 y es 

(Sa Az = 2x+1 A y= (+1) A 
root := Xx 
{voot Sa: (roots 1)°} 


end 


Informeel geldt bijvoorbeeld: 
{b = 18} root(b) {root(b) = 4} 
Formeel geldt voor de assignment statement 
x := root(b) 
met als postconditie x = 4 voor de preconditie: 


{b 2 0 A root(b)? < b < (root(b) +1)? A root(b) = 4} 
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ofwel 
Ib è OA 16 sb: 25 
of wel 
{16 < p< 25} è 


Opmerking 


In het voorbeeld van de functie facf werd een lokale hulpvariabele h 
gebruikt waarvan de eindwaarde aan de naam van de functie werd 
toegekend. Deze - schijnbaar overbodige - handelswijze komt bij 
functies vaker voor. We zullen de reden daarvan toelichten aan de 
hand van onderstaande functie die een machtsverheffing berekent. 


function machts(x,y: integer): integer; 
{pre: x 2 0OAy > O0 
post: machts (x,y) = xY} 
var f,1,2:s integer; 
begin if x = 0 then machts := 0 {machts = xY} ; 
else begin zie 1; i:»=y; f:= x; {inv.: z*f* = xI} 
while i <> 0 do 
begin while not odd(i) do 


Dogin í s= í iy Z3 
f := sgr(f) 
end; 
i := iel; z := fZ 
end; 
{z * fi=xYai+=0} 
machts := Z 


{machts = xY} 
end 
end 


In de body van de functie mogen meerdere toekenningen aan de naam 
van de functie voorkomen. Maar de naam van de functie is geen 
lokale variabele; de waarde ervan kan dus niet geaccesseerd worden. 
Zo kunnen we in de functie machts niet schrijven machts := f * machts 
in plaats van z := f # z; machts in het linkerlid is wel toegestaan 
maar machts in het rechterlid niet. Deze laatste wordt namelijk in de 
expressie als aanroep van de functie opgevat maar heeft dan een 
foutief aantal actuele parameters (namelijk géén in plaats van twee 
zoals de declaratie aangeeft). In paragraaf 1.5 komen we hierop 
terug. Vandaar dat de hulpvariabele z is ingevoerd. Het gebruik 

van zo'n hulpvariabele om het gewenste resultaat in 'op te bouwen' 
komt bij functies vaak voor. De body van de functie eindigt dan met 
een toekenning van de waarde van de hulpvariabele aan de naam van 
de functie. e 
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GLOBALE VARIABELEN 


We behandelen nog een voorbeeld. De (wiskundige) rij getallen van 
Fibonacci (f; met i > 0) is gedefinieerd door: 


Ni e e 


voor i22. 
De volgende functie berekent het ne getal uit de rij van Fibonacci 
(st). 


function fib(n: integer): integer; 
pre: n 2 0 
post: fib(n) = fp} 
var a,b,i: integer; 
begin {n 2 0} 
AR ORD ER 1; 1: ee Q3 
{inv.: a = fj Ab = fitt A OQ 
while i <> n do 


begin b := a+b; 


IA 
H- 
IIA 


n} 


a := b-a; 
i := i+Í 
end; 
RS BiA hef AOS nn Le nk 
fib := à 
(fib = £} 


end 


Tot nu toe hebben we het gebruik van globale variabelen, variabelen 
die geen parameters zijn en ook niet in de procedure of functie zijn 
gedeclareerd, uitgesloten. Het principe moet ook zijn dat globale 
variabelen zoveel mogelijk vermeden worden. Er zijn echter situaties 
waarin het gebruik van globale variabelen toelaatbaar is. 

Stel dat in een programma op een aantal verschillende plaatsen 
getallen uit de rij van Fibonacci nodig zijn. Bekend is dat er nooit 
een grotere fi nodig is dan fu (bij gegeven M); niet bekend is of 
deze fM ook echt ooit nodig is. De volgorde waarin de fi's nodig zijn 
is ook niet bekend. Het is natuurlijk mogelijk de eerder gegeven 
functie te gebruiken. Maar als eerst f5gg nodig is en later f100 dan 
wordt voor de berekening van f500 ook f100 berekend en daarna 
wordt dat nog eens overgedaan. In dit geval is met vrucht gebruik 
te maken van de variabelen 


var f: array [O..M] of integer; 
a: 0.. M; 


waarvoor in het programma, na de initialisatie, steeds zal gelden 
(Ai : OS isa: fli] = £;). Dit noemen we een globale invariant. 
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Omdat var-parameters in een functie niet zijn toegestaan zullen we f 
en a als globale variabelen moeten gebruiken. Hun betekenis nemen 
we echter wel op in de pre- en postconditie van de functie! 

De initialisatie is - in het omvattende programma -: 


flo] z= 0p Fli sels a s:n 1 


De volgende functie berekent nu een fp alleen als n> a. Is dit het 
geval dan worden, als neveneffect, fą+1,...»fn in het globale array 
geplaatst en krijgt a de waarde van n. 


function fib(n: integer): integer; 
pre: n 2 QA a =agp 2 ian (Ais: 0 
posts ibn) = MA (WAR 
(Ai : OS isas flij = £3) 
var Ss,t,i: integer; 
begin if n Sa then fib := f[n] {fib = fp} 
else begin s := fla-1]; t := fla]; {inv.: s = 
t = fa A \Al:0sSsisa: eri 
while a<>n do 
begin t :=Stt;s :=t-s; a:=a+1; fla] :=t end; 
(sf AFP AN Oi aas f[i] =EN 


sisay: Sipe f) 
REA 
} 


a 

a = n} 

fib := t 

(fib: =£} 

end 
(fib = fo ALA DO Sisa s BEEN} 
end 
PARAMETERTYPEN 


Ook bij functies geldt dat bij de type-aanduiding van de formele 
parameters alle typen mogen voorkomen die op de plaats van declara- 
tie van de functie gedeclareerd zijn; de overeenkomstige actuele 
parameters bij aanroep zullen van hetzelfde type moeten zijn. Net 
zoals bij procedures zullen we voor array-typen wat meer vrijheid 
wensen; we zullen ook hier als type-aanduiding een definitie van 

een array-type toestaan zonder concrete vastlegging van het domein. 


Voorbeeld 


function somf (a: array[first..last: integer] of integer): 


integer; 
{pre: first á last 
post: somf(a) = (Sj : first $3 S last : alj])} 
var S,i: integer; 
begin i := first; s := alil; 
{invi sieutBhe first suj str all} 


while i <> last do 
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{ 


end 


— ae 


S 


begin i := i+1; s := stalil end; 


B) e first soas iran] Aie last} 
somf := 
{somf 


S 
(Sje first $ jJ elast ie alj] 
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Als type van de functiewaarde zijn in Pascal slechts de enkelvoudige 


- ongestructureerde - typen toegestaan. Ook wat dit betreft zullen 


we ons wat vrijheid veroorloven. We zullen hier alle gedefinieerde 
typen als resultaat-type toestaan om aldus het functiemechanisme zo 


algemeen mogelijk te kunnen gebruiken. Vooral in deel II, typering 


en structurering van waarden, zullen we met vrucht van deze alge- 
mene vorm gebruik maken. Hier volstaan we met een voorbeeldje 
waarin het record-type als resultaat-type gebruikt wordt. 


type datum 


end 


zarecord.d:-1e.34s me -13x127 Je 1900..1999 end; 
function next(dag: datum): datum; ed 
{pre: true 
post: next (dag) = de datum van de dag die volgt op 'dag'} 
var aantal: 28..31; 
v: datum; 
begin with dag do 
begin case m of 


1,3,5,7,8,10,12: aantal := 31; 
4,6,9,11: aantal := 30; 
2: if (j mod 4 = 0) and (j <> 1900) 


then aantal := 29 
else aantal := 28 


end; 
if d = aantal then 
begin v.d := 1} 


if m= 12 
then begin v.ms:= 1; v.j := j+t1l end 
else v.m := m+1 Hee 
end 
else v.d := d+1 
Vv 


Deze functie kan bijvoorbeeld gebruikt worden in een statement als: 


VEN arr (PROG 
if next((28,2,x) 


S 
) 


X 
e IN 


S 


1999} 
3 then write (x,'is geen schrikkeljaar'); 
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14 PROCEDURES EN FUNCTIES ALS PARAMETER 


Tot nu toe zagen we alleen parameters van een data-type: als para- 
metertype is toegestaan elk op de plaats van declaratie gedefinieerd 
type, waarbij we ons voor array-typen enige vrijheid kunnen ver- 
oorloven. Evenals in Pascal staan we ook procedures en functies als 
parameter toe. \ 

Een formele procedure /functie parameter wordt gespecificeerd 
door een formele naam gevolgd door een lijst van parameters met hun 
type en rol; bij functies wordt vanzelfsprekend ook het type van de 
functie aangegeven. Parameters van een procedure/functie type 
mogen alleen value-parameter zijn. 


Voorbeelden 


procedure vbl(procedure p; var a: integer); 
procedure vb2(procedure pp(var x: real; y: integer); 
var a: integer; b: real; 
function f(x: real): real); 


function vb3(function f(x,y: integer): integer; 
a,b: integer): integer; 


De formele namen voor procedures/functies als parameter hebben 
betekenis in de body van de procedure of functie waarin ze als para- 
meter optreden: in die body zal eraan gerefereerd worden. De namen 
die gebruikt worden om de parameters van procedures /functies als 
parameter aan te duiden hebben verder geen betekenis: in de body 
bestaan ze niet. Als in de body zo'n procedure of functie aangeroe- 
pen wordt moeten als parameter meegegeven worden aldaar bestaande 
variabelen /waarden (bijvoorbeeld lokale variabelen, andere parame- 
ters, constanten). 


Voorbeeld 


De declaratie van een functie met een functie als parameter: 


function som(function f(x: integer): integer; a,b: integer): 


integer; 
{pre: a <b | 
posts son(fsa,kt m tSr ts tse ECI) 
var i,s: integer; S 
begin item az exs f(a); 
OOE r sta aA E Aa sd SD} 


begin i := itl; s := stf(i) end; 
som := S 
(som = (Bj sa sds br f()})} 


end ® 
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Als een procedure of functie met een functie/procedure als parameter 
wordt aangeroepen zal de corresponderende actuele parameter een 
gedeclareerde functie/procedure moeten zijn met een zelfde lijst van 
parameters als de formele, en een functie zal tevens van hetzelfde 
type moeten zijn. Alhoewel in Pascal standaardproeedures en -func- 
ties niet als actuele parameter zijn toegestaan, zullen we hier ook 
deze als gedeclareerd beschouwen en dus wél toestaan als actuele para- 
meter. Als de aangeroepen procedure of functie uitgevoerd wordt, 
zal elke referentie in de body aan de formele functie /procedure para- 
meter resulteren in een aanroep van de actuele. 


Voorbeeld 


Een aanroep van de functie som met als actuele parameter de 
(standaard) functie sqr: 


p := som(sqr,1,100) 


zal aan p de waarde toekennen van de som van de kwadraten van 1 
tot en met 100. atie 


Voorbeeld 


function zero(function f(x: real): real; a,b,e: real): real; 
{pre: sign(f(a)) # sign(f(b)) 
post: zero(f,a,b,e) = 'het nulpunt van f in het interval 
[a,b] met nauwkeurigheid e'} 
var s: boolean; 
per real; 
begin s := f(a) < 0; {inv.: nulpunt in [a,b] A s= f(a) <0} 
while abs(a-b) >= e do 
begin x := (atb)/2; 
z = f(X); 
if (z < 0) =s then a s= x else Dis x 
end; 
zero := X 
end; 
function par(x: real): real; 
begin par := x *x=-l1 end; 


De functie zero kan nu gebruikt worden om het positieve nulpunt van 
f(x) = x?-1 te bepalen met: 


nulp := zero(par,0.5,1.5,0.001) ® 
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Voorbeeld 


procedure tabelleer(function f(x: real): real; a,b,c: real); 
Dre: OS as cAmeD 
post: in de uitvoerrij is getabelleerd: 
f (a) ,f(atb),f(at2b),...,f(atkb) met 
((atkb) < c A (a+ (k+i)b) > c)} 
var h: real; 
begin h := a; writeln; 
writeln(h:s 12, f(h): 20); 
{inv.: getabelleerd zijn f(a),...,£(h) met h=ati.b} 
while h+b <= c do 
begin h := h+b; 
writeln(h: 12, f(h): 20) 


end 
{getabelleerd zijn f(a),...,f(h) Ah = ati.b A 
h+b > c} 
end 


Deze procedure kan bijvoorbeeld gebruikt worden voor het tabelleren 
van sinuswaarden met de statement 


tabelleer(sin,0.0,0.01,1.0) 
of voor het tabelleren van wortelwaarden met de statement 


tabelleer(sqrt,0.0,1.0,100.0) hed 


Bij het werken met procedures en functies als parameter ontstaat 
snel het gevaar van erg ondoorzichtige programma's. Het is hier dus 
extra belangrijk het effect van zo'n procedure/functie zeer nauwkeu- 
rig vast te leggen! 


1.5 RECURSIE 


De body van een procedure of functie bestaat uit een rij statements 
waarin expressies kunnen voorkomen. Een mogelijke statement is de 
procedure statement; een mogelijk deel van een expressie is de 
function designator. In de body van een procedure of functie mogen 
dus aldaar gedefinieerde functies en procedures aangeroepen wor- 
den; we zagen daarvan reeds voorbeelden. In de body geldt echter 
dat de procedure of functie zelf daar reeds is gedefinieerd; er mogen 
dus aanroepen van de procedure of functie zelf in de body voorko- 
men. We spreken dan van recursie. De procedure of functie heet 


recursief gedefinieerd en de aanroep van de procedure of functie 
zelf heet recursieve aanroep. 
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Recursie is een programmeermethode die aansluit bij: 


a. berekeningen van begrippen die gedefinieerd zijn door middel van 
recurrente betrekkingen; 

b. een methode van probleem oplossen die we kunnen omschrijven 
als: los een probleem ter grootte N op door het terug te brengen 
tot één of meer problemen (van dezelfde soort) ter grootte M, met 
M < N, totdat de grootte van het probleem zodanig klein is dat 
een oplossing ervoor direct te geven is, 


Het zal duidelijk zijn dat deze twee zaken veel samenhang vertonen. 
In het algemeen zullen we bij de in b. genoemde methode ook de 
recurrente betrekking trachten te vinden. De ene keer zal de relatie 
van een programmeerprobleem met a. het uitgangspunt zijn, een 
andere keer de relatie met b.; vaak zullen zowel a. als b. een rol 
spelen. 


Voorbeeld 
Faculteit kunnen we definiëren met de recurrente betrekking: 


0! 


1 
n! n * (n-1)! voorn > 0 


Op grond van deze definitie kunnen we een recursieve functie decla- 
reren: 


function fac(n: integer): integer; 


{pre: n 2 0 
post: fac(n) = n!} 
begin if n = 0 then fac := 1 
za else fac := n x fac(n-1) 
{fac = n!} 
end e 


In het voorbeeld van de functie fac staat de statement 
fac := n * fac(n-1) 


in de body; fac in het linkerlid staat daar op grond van het feit dat 
in de body van een functie een waardetoekenning aan de naam moet 
plaatsvinden; fac in het rechterlid is de recursieve aanroep van de 
functie en is dan ook voorzien van een (actuele) parameter. 


Voorbeeld 


Een functie die als resultaat oplevert: de som van de cijfers van (de 
decimale representatie van) een niet-negatieve gehele waarde, Als 
we zo'n som van de waarden es(n) noemen kunnen we es(n) als 
volgt definiëren: 
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cs(n) n voor n < 10 
es(n) = es(n div 10) + n mod 10 voorn z 10 


De volgende functie maakt direct gebruik van bovenstaande definitie: 


function cijfersom(arg: integer): integer; 
pre: arg 2 0 
post: cijfersom(arg) = cs(arg)} 
var kop,staart: integer; 
begin {arg 2 0} 
if arg < 10 then cijfersom := arg 
else begin kop := arg div 10; 
staart := arg mod 10; 
cijfersom := cijfersom(kop) + staart 


end 
{cijfersom = cs(arg) } 
end y 


Om de correctheid van recursieve procedures /functies aan te tonen 
moet bekeken worden of het geheel van aanroepen eindigt, en als 
dit het geval is of het juiste effect bereikt wordt. In een recursieve 
procedure /functie zullen de recursieve aanroepen altijd gebeuren 
onder een of andere conditie. In deze conditie zullen een of meer 
parameters van de procedure /functie voorkomen; bij een recursieve 
aanroep zullen de (actuele) parameters een zodanige waarde hebben 
dat de ontkenning van de conditie 'een stapje dichterbij is gekomen'. 
In het voorbeeld van de functie fac is de actuele parameter bij de 
recursieve aanroep (onder de conditie: ‘argument >0') 1 kleiner dan 
de parameter waarmee de functie fac oorspronkelijk werd aangeroe- 
pen, zodat de situatie ‘argument is nul' dichterbij komt. De reeks 
van successieve aanroepen van fac, steeds met kleiner wordend 
argument, zal dus gegarandeerd resulteren in een aanroep met als 
argument 0 waarvoor direct, zonder verdere recursieve aanroep, het 
resultaat bepaald wordt. 

Dat het juiste effect wordt bereikt kunnen we laten zien door 
gebruik te maken van volledige inductie. Als voorbeeld nemen we 
weer de functie fac. De functie levert het correcte resultaat voor 
argument 0. Uitgaande van de aanname dat de functie het correcte 
resultaat levert voor argument k (k > 0) volgt uit toepassing van de 
semantiekregels voor de statements in de body dat de functie ook 
het correcte resultaat oplevert voor k+1. Daarmee is aangetoond dat 
de functie het correcte resultaat oplevert (voldoet aan de specificatie 
door middel van pre- en postconditie) voor alle argumenten 2 0. 

Door de aanroep van een recursieve functie of procedure ontstaat 
een geneste structuur van aanroepen. Iedere aanroep creëert een 
lokale toestandsruimte, die volledig onafhankelijk is van de vorige 
toestandsruimte van waaruit deze aanroep plaatsvond, ook al hebben 
de lokale variabelen dezelfde naam. Zo heeft de functie cijfersom 
twee lokale variabelen. Een aanroep van ciĳjfersom resulteert in een 
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eigen toestandsruimte met twee lokale variabelen, kop en staart. 
Door de recursieve aanroep ontstaat een nieuwe toestandsruimte, 
met twee eigen, lokale variabelen; pas als deze recursieve aanroep 
is beëindigd, en dus de cijfersom van kop is berekend, al dan niet 
door verdere recursieve aanroepen, wordt teruggekeerd naar de 
eerste toestandsruimte en kan bij het verkregen resultaat de waarde 
van staart worden opgeteld. 

Zowel voor het bepalen van de cijfersom als voor het berekenen 
van de faculteit geldt dat ze gerealiseerd kunnen worden door niet- 
recursieve (iteratieve) functies of procedures; voor de faculteit 
zagen we dat reeds. 


De tot nu toe gegeven voorbeelden waren recursieve functies. Ook 
recursieve procedures zijn mogelijk: 


procedure keerom(n: integer); 
pre: n 2 0 
post: de cijfers van n zijn in omgekeerde volgorde in 
de uitvoerrij geplaatst} 
begin write(n mod 10); 
if n >=10 then keerom(n div 10) 
a 


Opmerking 


Een voorbeeld van een recursieve procedure zonder parameters is 
het volgende. De procedure zet de waarden uit de invoerrij (gehele 
getallen) in omgekeerde volgorde in de uitvoerrij. 


procedure reverse; 
pre: input = <agr-..:ap? ^ output = <begin> 
post: input = < > A output = <begin; äni >». ä0?} 
var x: integer; 
begin if not eof then 
~ begin read(x); reverse; write(x) end 


end 


Recursie lijkt een eenvoudige manier van programmeren voor pro- 
blemen die met recurrente betrekkingen gedefinieerd zijn. Het blijkt 
echter ook een inefficiënte manier van berekening te kunnen opleve- 
ren; er wordt vaak bij de berekening (veel) meer gedaan dan nodig 
is. 

Als voorbeeld bekijken we de getallenrij van Fibonacci waarvoor 
we al eerder een algoritme zagen dat, om fn te berekenen, ongeveer 
n 'slagen!' van de repetitie uitvoerde. De rij is gedefinieerd als: 


fg = 0, f1 = 1, 


M= +fj-2 Vori i 
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Deze definitie is direct te vertalen tot een recursieve functie: 


function fib(i: integer): integer; 
pres.1:5 0 
post: fib(i) = £4} 
begin if i <= 1 then fib := i 
ge else fib := fib(i-1) + Fib(i-2) 


end 


Het aantal malen dat de functie aangeroepen wordt om fn te bereke- 
nen bepalen we als volgt. 

Zij Aj het aantal malen dat de functie fib aangeroepen wordt om 
fj te berekenen. Dan geldt: 


Ag =1 
Arad 
A art Ag TARS voor i22, 


(eenvoudig te bewijzen met volledige inductie). Dit aantal aanroepen 
om fp te berekenen is heel wat groter dan het aantal slagen van de 
repetitie bij de iteratieve oplossing. Bijvoorbeeld: om fjj te bereke- 
nen zijn bij de iteratieve oplossing ongeveer 11 slagen van de repe- 
titie nodig, bij de recursieve oplossing zijn 287 functie-aanroepen 
nodig. 

Het is dus zaak bij recursie zeer goed op de efficiëntie te letten. 


Recursie wordt vaak moeilijk gevonden omdat men zich het proces 
tracht voor te stellen dat plaatsvindt als gevolg van de aanroep van 
een recursieve functie of procedure. Als men echter recursieve 
functies en procedures bekijkt in termen van het effect is het 
gebruik en de constructie ervan niet zo moeilijk en geven recursieve 
algoritmen voor sommige problemen juist duidelijke en begrijpelijke 
oplossingen. 

Als voorbeeld het probleem van de berekening van een waarde 
van de wiskundige Ackermann functie die door middel van een 
recurrente betrekking gedefinieerd is: 


n+1 voor m = 0 
A(m,‚n) = 4A(m-1,1) voor n = 0 
A(m-1,A(m,‚n-1)) voor m > 0, n > 0 en geheel. 


Hier volgt direct een functie ter berekening van A(m,‚n): 
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function FA(m,n: integer): integer; 
pres ma 0 An 2.0 
post: FA(m,n) = A(m,n)} 
begin if m = 0 then FA := n+l 
~ else if n = 0 then FA : 
eg else FA : 


FA(m-1,1) 
FA(m-1,FA(m,n-1)) 


end 


Een ander voorbeeld is het klassieke probleem van de torens van 
Hanoi. Gegeven zijn drie pinnen, die we 'een', 'twee' en 'drie' zullen 
noemen, waarover schijven geschoven kunnen worden. Er zijn n 
schijven, alle met een verschillende diameter. In de beginsituatie 
zitten alle schijven op pin 'een', en wel zodanig dat (afgezien van de 
onderste schijf) iedere schijf ligt op een schijf met een grotere dia- 
meter. Gevraagd wordt de n schijven over te brengen van pin 'een' 
naar pin 'drie' (met gebruikmaking van pin 'twee'), waarbij de vol- 
gende regels in acht moeten worden genomen: 


- er mag steeds maar één schijf tegelijk verplaatst worden; 

- nooit mag een schijf liggen op een schijf met een kleinere dia- 
meter; 

- steeds moet elke schijf op één van de drie pinnen liggen (behalve 
tijdens het verplaatsen van één schijf). 


We kunnen het probleem (het verplaatsen van een toren van n (2 1) 
schijven van pin 'een', met gebruikmaking van pin 'twee', naar pin 
‘drie! met inachtneming van bovenstaande regels) als volgt aanpak- 
ken: | 


- als n = 1 dan kan de ene schijf direct van pin 'een' naar pin 
'drie' verplaatst worden; 
- als n > 1 kunnen we het probleem reduceren tot een zelfde pro- 
bleem voor het verplaatsen van n-1 schijven: 
‚ verplaats de bovenste n-1 schijven van pin 'een', met gebruik- 
making van pin 'drie', naar pin 'twee'!; 
verplaats de overgebleven schijf direct van pin 'een' naar pin 
‘drie '; 
verplaats de toren van n-1 schijven van pin 'twee!, met 
gebruikmaking van pin 'een', naar pin 'drie'. 


Het patroon van deze oplossing voldoet aan de recursieve aanpak 
zoals we die eerder voor andere problemen gezien hebben. Bij deze 
aanpak wordt voldaan aan de gestelde regels. 

Het programma moet aangeven welke de achtereenvolgende ver- 
plaatsingen van schijven zijn. Het programma luidt: 
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program Hanoi(input,output); 
type pin = 1..3; 
pos = 1..maxint; 
var aantal: pos; 
procedure verplaatstoren(n: pos; een,twee,drie: pin); 
procedure verplaatsschijf(van,naar: pin); 
begin write( ‘verplaats een schijf van pin'); 
write(van); write( 'naar pin'); 
writeln(naar) 
end; 
begin if n = 1 then verplaatsschijf(een,drie); 
else begin verplaatstoren(n-1,een,drie,twee); 
verplaatsschijf (een,drie); 


verplaatstoren(n-1,twee,een,drie) 
end 
end; RE 
begin read(aantal); 


writeln; writeln( 'voor',aantal: 3, 'schijven', 


‘zijn de verplaatsingen achtereenvolgens: '); 


verplaatstoren(aantal,1,2,3) 
end. 


Het aantal schijf verplaatsingen H(n) voor een toren van n schijven 
berekenen we als volgt: 


H(1) 
H(n) 


1 
1 + 2 (nr 1) (n > 1) 


Hieruit kan worden berekend dat H(n) = 20 - 1 voor n2 1. Bij een 
toren van 4 schijven is het aantal schijfverplaatsingen 15, bij een 
toren van 64 schijven 264- 1 (~ 1019). Dit grote aantal schijf ver- 
plaatsingen wordt hier (in tegenstelling tot de recursieve versie van 
fib) niet veroorzaakt door de recursieve oplossing; het is een eigen- 
schap van het probleem. 


In de tot nu toe besproken voorbeelden vond in de functie of proce- 
dure een aanroep van de functie /procedure zelf plaats. We spreken 
in zo'n geval van directe recursie. Ook indirecte recursie is moge- 
lijk. Indirecte recursie vindt plaats als twee (of meer) procedures / 
functies elkaar wederzijds kunnen aanroepen. Bijvoorbeeld: 


procedure P(...); 
ven tree Cka? 
procedure Q(...); 
eb a ET T, 


Bij de declaratie zal dan in de body van de eerst gedeclareerde de 
naam van een andere, nog niet gedeclareerde, functie of procedure 
voorkomen. Om te vermijden dat in het programma een nog niet 
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gedeclareerde naam voorkomt, moet in zo'n geval een forward decla- 
ratie plaatsvinden, waarbij de body van deze procedure /functie is 
vervangen door het symbool 'forward'. Later zal de echte declaratie 
volgen. 


Voorbeeld 


function B(x: integer): char; forward; 
procedure A(var y: char); 
begin .. wa 
y te Bi); 


end; 
function B(x: integer): char; 
begin is. 
A(c); 


end 


1.6 POLYMORFIE 


In paragraaf 1.2 (blz. 18) zagen we reeds als voorbeeld de procedure 
swap die de waarde van twee integer variabelen verwisselde. Als we in 
een programma de verwisseling van waarde van twee variabelen als 
statement willen beschrijven, zullen we zo'n procedure gebruiken. 
Echter, als we de verwisseling willen voor twee variabelen van het 
type integer, en voor twee variabelen van het type real, en voor 
twee variabelen van het type ..., enzovoort, moeten we voor elk 
type een andere procedure declareren en aanroepen. Deze handel- 
wijze is wat onnatuurlijk: voor dezelfde soort actie verschillende 
beschrijvingen die hetzelfde realiseren, alleen het type van de ele- 
menten verschilt. We kunnen aan dit bezwaar tegemoet komen door 
toe te staan een actie te beschrijven in termen van een formeel type, 
waarna voor verschillende typen aangegeven kan worden dat die 
actiebeschrijving voor die typen gedefinieerd is. 

Bij declaratie van een procedure of functie kan aangegeven wor- 
den dat de actiebeschrijving onafhankelijk is van een bepaald type 
door het symbool type voor de type-aanduiding van parameters en / 
of functietype te plaatsen. Bijvoorbeeld: 


procedure wissel(var x,y: type T); 
var n: T) 
begin h := x; x := y; y := h end; 
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Instanties van zo'n procedure/functie voor een bepaald type kunnen 
dan gedeclareerd worden met vermelding van het specifieke type. 
Bijvoorbeeld: 


procedure wisselint = wissel(integer); 
procedure wisselreal = wissel(real); 


of 
type adr = record n: naam; 
Si straat? 
w: woonplaats 
end; 
procedure wisseladr = wissel (adr); 


Het gebruik van deze zogenaamde 'generic'-faciliteit, die een ruime 
mate van veelzijdigheid (spolymorfie) toestaat, levert de mogelijk- 
heid processen te beschrijven voor een willekeurig type, waarna 
voor specifieke typen zo'n proces uitgevoerd kan worden. Het 
gebruik van die veelzijdigheid kan dynamisch gebeuren: in de ene 
procedure kan, afhankelijk van het type van de elementen waar 
deze op opereert, een instantie gedeclareerd en gebruikt worden, in 
een andere procedure een andere instantie, etcetera. Let wel: deze 
polyformie is niet mogelijk in Pascal. 


Voorbeeld 


procedure sort(var a: array [f..l: integer] of type Ty); 
{pre: alf..l] = X[f..1] A Ty is een geordend type 
post: (Ak : f <k < 1 : alk-1] < alk]) 
A alf..l] is een permutatie van X[f..1]} 
varsd,js intëger; 
procedure swap = wissel(Ty); 
begin i := f; 
(inver (Ak: E € kom denik- tl goal: n 
A s luatkl:s.alsi)) 
A alf.. L] is een permutatie van X[£..1]} 
while i < 1 do 
begin j := itl; {inv.: (Ak: i < k < j:alil S alk})} 
while j <= l do 
begin if alj] < ali] then swap(alil,aljl); 
getij 


end; 
Tse 1] 


end 
end; 


Deze procedure sort, voor het formele type Ty, kan nu gebruikt 
worden voor het sorteren van elementen van verschillende typen. 
Een instantie voor het sorteren van integers kan dan gecreëerd wor- 
den door 
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procedure si = sort(integer); 


en later aangeroepen worden. Bijvoorbeeld als gedeclareerd is 


var ar: arrayl1..nl of integer; 


en dit array heeft een waarde, dan kan het gesorteerd worden door 
de procedure statement 


silar); 3 


Een andere vorm van polymorfie kennen we eigenlijk reeds. De ope- 
rator + is voor verschillende typen gedefinieerd: voor integers, voor 
reals, en - meestal - zelfs voor integers en reals door elkaar. Deze 
vrijheid voor het gebruik van operatoren voor verschillende typen 
kunnen we gebruiken door 'overloading' van operatoren toe te staan. 
Door een operator (bijvoorbeeld +, -, x, <, =, >=, etcetera) als func- 
tie te declareren met twee argumenten van een bepaald type (niet 
noodzakelijk hetzelfde), kan de operator later ook voor dat/die 
type(n) gebruikt worden als infix-operator. In feite is dit voor de 

+ en - operator reeds impliciet gebeurd! 


Voorbeeld 


type vector = array[1..n] of integer; 
var a,b,c: vector; Be 
function '+'(x,y: vector): vector; 
pre: true 
posts (Aj's 1i5-j Sn s zijl =x] + y[j])} 
var Z: vector; 
BEET integer; 
begin i := 1; 
while i <=n do 
begin zli] := x[i] + ylil; 
i ¿= 1+1 


end; 
return z {d.w.z. de waarde van z wordt als 
functiewaarde geretourneerd} 
end; 


Nadat a en b een waarde hebben gekregen kan deze operator bijvoor- | 
beeld gebruikt worden in 


C :=a+b 
waarna geldt: 


Rt ISA stij e= KEEI-+: DEL e 
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Bij 'overloading! van operatoren blijft het zaak zo'n operator niet toe 
te passen op operanden waarvoor de operator niet gedefinieerd is; 
tevens kan bij verschillende typen operanden de operator een ver- 
schillend effect realiseren. Het is de taak van de programmeur hier 
op een correcte manier mee om te gaan! Ook deze overloading is 
geen Pascal-mogelijkheid! 


17 OPGAVEN 


1. Schrijf een procedure die voor een gegeven drietal a, b en ce de 
wortels bepaalt van de vergelijking ax? + bx +e = 0. 


Do 


. Schrijf een procedure die voor gegeven gehele getallen n en b, 
n > 0 A2 <b <10, de representatie van n in het b-tallig stelsel 
afdrukt. 


3. Schrijf een procedure met als heading: 


procedure amb(a,b: integer; var c: integer); 
{pre: a > O0 AbeEZO 
post: c = ab} 


4. Schrijf een procedure met als heading: 


procedure sort(var x: arraylf..l: integer] of 0..1); 
{pre: x[f..1] = x[f..1] WE 
post: (At €f FAs Lir xls xlitij 
A x[f..l] is een permutatie van X[£..1]} 


9. Schrijf een procedure met als heading: 


procedure p(M,N: integer); 
{pre: OSMSNA 
input Sarat y ss. ran”? A 
(Ai : O i S n:0 S aj < 100) 
post: input KEEL 
output = <'gesorteerd alle waarden w, O < w < 100, 
die ten minste M en ten hoogste N keer 
voorkwamen in input'>} 


i IA 


HA 


6. Schrijf een functie met als heading: 


function ls(a: array{0..n] of integer): boolean; 
{pre: DSN 


post: tsa) = (Bi iV Si SN: ali] = aln})} 
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T. Schrijf een functie met als heading: 
function aant(x: arrayl0..n] of integer): integer; 
pres 0 Sn A (Ai: 0< i<n : fils xfi+1}) 
post: aant(x) = 'het aantal verschillende waarden in x'} 
8. Schrijf een functie met als heading: 
function f(x: arraylfi..l: integer] of boolean): integer; 
pre: true 
posts EUNE Nij: FLS 4 < j Si: x[il =false A 
x[j] = true) } 
9. Schrijf een functie met als heading: 
function pal(a: arrayl0..nl of char): boolean; 
{pre: O< n 
post: pal(a) = 'a bevat een palindroom' 
= (Ai : OS isSndiv2:alil =- aln-ij)} 
10. Schrijf een functie die voor elke functie f(x): real het maximum 
kan bepalen op een discreet interval [m..n]. 
11. In een array 
var a: arrayl0..nl of integer 
definiëren we een segment als een deelrij ali..i+p] met 0 < i en 
itp son CPE 0). 
We noemen een segment a[i. .i+p] linksmaximaal als geldt: 
(Ax : i £ x < itp : ali] z alż)) 
Schrijf een functie die voor een array a[0..n] de lengte van het 
langste linksmaximale segment berekent. 
12. a. We noemen een segment afi. .i+p] van een array a[0..n] (zie 


opgave 11) glad als geldt: 
Aky tiS XS LGpaAiGy S itp: alx] = aly] s 1) 


Schrijf een functie die voor een array a[0..n] de lengte van 
het langste gladde segment berekent. 


b. Stel dat we de definitie voor glad veranderen in 


(Ax‚y : i SxS itpaAisysitp : alx] - aly] SK) 


(k 2 1). Schrijf nu een functie die de lengte van het langste 
gladde segment berekent. 


44 Voortgezet programmeren 


13. 


14. 


15. 


16. 


Schrijf een functie die bepaalt of in een array van het type 
integer een segment (zie opgave 11) van louter positieve getallen 
voorkomt, waarvan de som van de elementen groter is dan een 
gegeven integer-waarde. 


De functie van Möbius, M(n), is gedefinieerd voor alle positieve 
gehele getallen n, en wel als volgt: 


- M(1) = 1 k 
- als n > 1: M(n) = (-1) indien n is te schrijven als het 
product van k verschillende priem- 
factoren, 
=0 in de overige gevallen. 


Schrijf een functie die bij gegeven n de waarde van M(n) bere- 
kent. 


a. Schrijf een functie die de sinus van een gegeven reëel getal 
met een bepaalde nauwkeurigheid benadert. De berekening 
moet met een reeksontwikkeling uitgevoerd worden. 


b. Tevens voor cosinus en tangens. 


c. Schrijf een procedure die voor het interval [0..2r] en een 
gegeven stapgrootte h de sinus, cosinus en tangens in tabel- 
vorm afdrukt. 


De rij van Fibonacci kan met de volgende recurrente betrekking 
gekarakteriseerd worden: 


fo ke 0 

1 5 2 2 

bonen Emer t ; 

f „of f + f2 voor alle n = 0. 
2n +2 n n+l n+1 


Schrijf een functie die met deze betrekking voor gegeven n, 
n z 0, fp} bepaalt: 


a. iteratief; 
b. recursief. 


2 SUPERSET; BACKTRACKING 


2.1 INLEIDING 


De eindrelatie R van een probleem definieert een oplossingsverzame- 
ling V. Het kan zijn dat deze verzameling moeilijk te genereren is, 
maar dat op relatief eenvoudige wijze een (kleine) omvattende ver- 
zameling W (W > V) is te genereren. Als nu ook nog op eenvoudige 
wijze is te bepalen of een element van W tot V behoort of niet, dan 
kan ter bereiking van R de verzameling W gegenereerd worden en 
daaruit afgeleid V. Deze wijze van werken noemen we: het genereren 
van een superset. Het op systematische wijze genereren van W is 
niet moeilijk als er een ordening is voor de elementen van W; de 
verzameling kan dan in deze volgorde gegenereerd worden. De aan- 
pak voor het bereiken van R wordt dan: 


'geef a de kleinste waarde van W'; 
while a < 'de grootste waarde van W' do 
begin if 'a € V' then 'element van V gevonden'; 
"bepaal opvolger van a in Wen, als er een 
opvolger is, ken deze waarde toe aan a! 
end 


Stel dat we alle permutaties willen bepalen van de cijfers 1, 2 en 3. 
Als we niet een algoritme weten om direct de oplossingsverzameling 
V te genereren, zouden we als omvattende verzameling W kunnen 
proberen: {123,130,131,132,133,200,201,202,...,321}, dit is de ver- 
zameling van alle 4-tallige getallen van 3 cijfers met als kleinste 
waarde 123 en als grootste waarde 321. Een element van W is een 
element van V als de drie cijfers verschillend zijn en de 0 er niet in 
voorkomt. 

We bekijken nu een speciale manier om een superset te genereren. 
Er is een grote klasse van problemen waarbij gevraagd wordt één rij 
of alle rijen X] X2X3 ... Xn te genereren, waarvoor eigenschap 
P(X1X2X3 ... Xn) geldt. Hierbij kunnen alle xj uit dezelfde keuze- 
verzameling komen, of voor elke xj (voor elke positie in de rij) is 
een aparte verzameling van mogelijkheden gegeven. 

In het voorgaande is gesuggereerd om voor zo'n soort probleem 
de superset van alle rijen ter lengte n te genereren en van elke rij 
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na te gaan of deze eigenschap P heeft. We zullen nu een grotere 
superset nemen. In eerste instantie nemen we als superset de ver- 
zameling van alle rijen ter lengte k met k = 0,1,2,...,n. Als ge- 
vraagd wordt alle permutaties te genereren van de cijfers 1, 2 en 3, 
nemen we dus niet de verzameling van alle 4-tallige getallen van 3 
cijfers als superset, maar de verzameling van alle rijtjes met de 
lengtes 0, 1, 2 en 3 van de cijfers 1, 2 en 3. Deze verzameling kun- 
nen we vastleggen in een boom: 


k =0 
1 2 k=1 

if 12 KNS! 22 23 31 32 kt 
k=3 


1211 113 122 131 133 212 221 223 232 311 313 322 331 333 
112 121 123 132 211 213 222 231 233 312. 321. 323 332 


Om er zeker van te zijn dat alle rijen precies één keer worden gege- 
nereerd, wordt er een volgorde afgesproken binnen de verzameling 
van alle rijen. We gaan er daarbij van uit dat in de verzameling(en) 
van mogelijkheden voor de xj een volgorde is gegeven. Als ordening 
voor de verzameling rijen kiezen we dan de lexicografische ordening 
(zoals de volgorde van woorden in een woordenboek). Voor het 
voorbeeld krijgen we dan: 1,11,111,112,113, 12, 121, 122, 123, 13, 131, 
132, 133,2, 21,211,212,..., 323, 33, 331, 332, 333. Maar niet deze totale 
verzameling wordt gegenereerd. Als bij het genereren van de rijen 
een rij ter lengte k is gemaakt (0 <k <n), waarvan duidelijk is dat 
deze niet uit te breiden is tot een rij ter lengte n die aan P voldoet 
(in het voorbeeld: de cijfers zijn verschillend), dan kan de 'sub- 
boom! die dit punt (deze subrij) als wortel heeft, overgeslagen wor- 
den. Zo behoeft bij het voorbeeld van de permutaties niet verder 
gegaan te worden als we zijn aangeland bij 11, want uitbreidingen 
(leidend tot de rijen 111, 112 en 113) kunnen nooit leiden tot een 
correcte permutatie (eigenschap P). Dit geldt ook voor de rijen 22 
en 33. Een subrij die bij uitbreiding nog wel kan leiden tot een 
oplossing zullen we in het vervolg een geoorloofde rij noemen. 
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Het op de aangegeven systematische wijze genereren van een 
superset wordt backtracking genoemd. De daaraan ten grondslag 
liggende lexicografische volgorde kan als volgt gedefinieerd worden: 


- de rij met nul elementen is de kleinste rij; 
- voor de rijen X1 X9X3 ... X; (1 < is n) en Y1Y2Y3-* Yj (A sj sn) 
geldt: 


X1 X9Xg... X; < Y1Y2Y3 ++: Yj 


als 


(x4 < y4) Vv (x4 =Y] A XoXo... X; < Y3 Y3 ar YJ) 
Voor elke rij ter lengte k (0 < k < n) kan nu zijn opvolger aangewe- 
zen worden, zo deze bestaat. Stel X is de verzameling keuzen voor 
alle xj en a = min(X) en b = max(X), en voor X is de functie suce 
(opvolger) gedefinieerd. Dan is de opvolger van de rij xj xg... xk: 


- GAS EK te X1 X9... XKAS 


- als k =n en Xp = Xpn-1 = --» =Xj4j =b en x; £ b (waarin j ook n 
kan zijn): X1X2... Xjes waarbij geldt dat'c = succ (xj). 


De lexicografische volgorde in de rijen kan steeds weergegeven wor- 
den als een boom. Het niet meer uitbreiden van een rij komt overeen 
met het 'afkappen' van de betreffende subboom. Wanneer er afgekapt 
moet worden, hangt van het probleem, van de eigenschap P, af. 

Het afkappen kan ook in de definitie van de volgorde van de rijen 
vastgelegd worden. Als xj X9... Xk een subrij is die niet geoorloofd 
is, maar waarvan de deelrij xj X9 ... Xxk-j nog wel geoorloofd is, dan 
wordt als opvolger van de rij X1X92 ...Xķę de rij xj X9.…. Xk-1C 
genomen met c = succ(xy), en niet de rij xj X2 ... Xka uit de lexico- 
grafische ordening van alle rijen. In het voorbeeld van de permuta- 
ties is de opvolger van de rij 11 niet de rij 111 maar de rij 12. 


2.2 REALISATIE VAN BACKTRACKING MET 
BEHULP VAN RECURSIE 


Backtracking is eenvoudig te realiseren met behulp van recursie. 
Stel dat de verzameling X, de mogelijke keuzen voor de xj, bestaat 
uit m elementen. Dan is het genereren van de boom volgens de lexi- 
cografische volgorde: het genereren van de wortel van de boom plus 
het in volgorde genereren van de m subbomen (of minder dan m als 
er subbomen zijn die niet geoorloofd zijn). De heading van de te 
realiseren recursieve procedure is: 
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procedure btr(k,n: integer; var x: oplossing); 
{pre: de subrij X1 X9 Et a is geoorloofd en alle 
voorgangers zijn gegenereerd 
post: alle opvolgers van de rij die in aanmerking komen 
als oplossing zijn gegenereerd} 


We zijn uitgegaan van het type 


type oplossing: arrayl 1..nl of X 


waarin X het type is dat past bij de mogelijke keuzen voor de x[i]. 
De grootte van X, het aantal mogelijkheden voor de xj, ligt vast in 
een globale variabele m. 

We werken de procedure uit: 


procedure btr(k,‚n: integer; var x: oplossing); 
var i; integer; 
begin i := 1; 
{inv.: alle voortzettingen tot geoorloofde rijen van 
Xi X2 vee Xk-1 XV met 1S yv < i, zijn gegenereerd, 
waarbij xV staat voor het vê element uit X} 
while i <= m do 
begin 'selecteer i element van X als waarde voor xk '; 
if 'XyXgeee Xk-1Xgy is geoorloofd" 
then begin ‘leg xyx2...Xg vast als geoorloofd'; 
if k < n then btr(ktl,n,x) 
else ‘oplossing gevonden'; 
‘verwijder vastlegging van subboom' 


end 
end 


Alle geoorloofde rijen worden gegenereerd door middel van de aan- 
roep btr(i,ñ,x). 

Backtracking is dus het zoeken naar een oplossing of de oplossin- 
gen XjXgX3... Xn voor een probleem met specificatie P(xjx2... Xn) 
door ‘deeloplossingen! xjx2...Xk-1 (K <n) te construeren waarvan 
gegarandeerd is dat ze consistent zijn met de specificatie van het 
probleem. Deze deeloplossingen worden uitgebreid, maar als daarbij 
een inconsistentie optreedt met P, dan wordt er teruggegaan naar 
de laatst gevonden deeloplossing en een andere uitbreiding wordt 
geprobeerd. De volgorde van de uitbreidingen is gebaseerd op de 
lexicografische volgorde. 


De eindigheid van de recursieve procedure is triviaal. De correct- 
heid volgt uit het voorgaande. 

Daar bij alle voorbeelden de pre- en de postconditie analoog zijn 
aan de bovenstaande condities, zullen we deze niet steeds vermelden. 
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Opmerking 


De variabele m veronderstelden we als globaal. De variabele (of con- 
stante) n zal in voorkomende gevallen ook als globaal (of bekend) 
gekozen kunnen worden, zie voorbeeld 1, 2. 

Het is ook mogelijk om de 'oplossing' x als globale variabele te 
gebruiken, zie voorbeeld 2. De betekenis van de globale variabele(n) 
moet echter wel vastgelegd en invariant gehouden worden. e 


Voorbeeld 1 


Gegeven een schaakbord (8 + 8 velden) en 8 koninginnen. Gevraagd 
wordt alle plaatsingen van de 8 koninginnen op het schaakbord te 
genereren zodanig dat geen enkele koningin een andere koningin 
aanvalt. 

Eén van de oplossingen is: 


We kunnen dit probleem opvatten als het genereren van alle rijen 
X1X2...Xg waarin xj (1 < i <8) de 'kolom' is (1 < xj <8) van de 
koningin ir 'rij' i, waarbij de waarden zodanig zijn dat de koningin- 
nen elkaar niet aanvallen. 

Voor we het standaardalgoritme kunnen toepassen moeten we 
eerst nagaan wat het voor dit probleem betekent dat de rij 
X1X92 ...Xę geoorloofd is. Voortzetting van de rij tot lengte n is 
zinloos als koningin k een van de eerder geplaatste koninginnen 
aanvalt. Om dit te kunnen constateren moeten we weten of er reeds 
een koningin in dezelfde kolom of in dezelfde linkerdiagonaal of in 
dezelfde rechterdiagonaal staat als waarin koningin k geplaatst is. 
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rij 


Er zijn voor het gehele bord 15 diagonalen die '‘van-rechts-onder- 
naar-links-boven' gaan. We noemen deze de linksdiagonalen. Voor 

elk van deze diagonalen geldt dat de som van het kolomnummer en 
van het rijnummer constant is. We kunnen de 15 diagonalen met deze 
sommen (2,3,4,...,16) identificeren. De diagonalen ‘van-links-onder- 
naar-rechts-boven!' zijn de rechtsdiagonalen, waarvoor het verschil 
tussen kolomnummer en rijnummer constant is (-7,-6,...,-1,0,1,.. 
.….,7). Voor de administratie van bezette en vrije velden kan gebruik 
worden gemaakt van drie boolean arrays: 


var ko: arrayl1..8] of boolean; 
dl: arrayl2..16] of boolean; 
dr: arrayl-7..7l of boolean; 


Als bijvoorbeeld a1[10] de waarde true heeft is de betreffende lin- 
kerdiagonaal vrij. 
De oplossingen worden vastgelegd in: 


var rij: arrayl1..8l of 1..8; 


waarbij rij[i] de kolomplaats is van de koningin in rij i. 
We krijgen dan het volgende programma: 


program achtkoninginnen (output); 
type oplossing: array[1..8] of 1..8; 
var var 1: integer; 
ko: arrayl 1..8] of boolean; 
dl: arrayl2..16] o. of boolean; 
dr: arrayl-7..7] of boolean; 
r: oplossing; 
proçedure koninginnen(k: integer; var rij: oplossing); 
[pre: de betekenis van ko, dl, dr; de rij rij[1..k-1] is 
geoorloofd 
post: alle voortzettingen van rij[1..k-1] zijn gegenereerd 
en de geoorloofde ter lengte 8 zijn afgedrukt } 
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var i,j: integer; 
begin J i+ Íj | 
{inv.: alle voortzettingen tot geoorloofde rijen van 
rijlilsssertijlk-1l,v, met 1 Sv < j, zijn 
gegenereerd, en die ter lengte 8 zijn afgedrukt} 
while j <= 8 do 
begin if ko[j] and dr[k-j] and dl[k+j] 
then begin rijlk] := j; 
kol jl := false; drlk-j] := false; 
dllk+j] := false; 
lr MR 
“then koninginnen(k+t1,rij) 
else for i := 1 to 8 
Rea do write(rijlil); 
kol jl := true; dr[k-j] := true; 
dl[k+j]l := true 


end; 


j := Jet 
end 
end; 
begin for 1 := 1 to 8 do koll] := true; 


for I om to 16 do dl[l] := true; 
for 1 := -7 to 7 do dr[1] := true; 
koninginnen(1,r) 
end. 7 


Voorbeeld 2 


We gaan uit van het array 


var a: arrayl0..35] of 0..1 


We bekijken de rijtjes a[0..4], a[1..5],...,a[30..34] en al31..351. 
Het array a kan een zodanige waarde krijgen dat al deze rijtjes ver- 
schillend zijn (en dus precies de binaire voorstellingen zijn van de 
getallen 0 t/m 31). | 

Gevraagd worden nu alle verschillende waarden van a waarvoor 
a de beschreven eigenschap bezit. Een waarde van a is verschillend 
van een andere waarde van a als de volgorde van de 32 binaire getal- 
len binnen a verschillend is (een oplossing die door 'rondschuiven' 
uit een andere oplossing is te verkrijgen, is dus niet verschillend 
van de oorspronkelijke oplossing). 

Om ervoor te zorgen dat de oplossingen verschillend zijn, zullen 
we het rijtje van vijf nullen als eerste rijtje nemen voor alle oplos- 
singen: a[0..4] = (0,0,0,0,0). Voor alle oplossingen zal dan ook 
moeten gelden: a[31..35] = (1,0,0,0,0), want de vier nullen kunnen 
niet elders binnen a voorkomen daar er na deze vier nullen een 0 of 
een 1 komt en de rijtjes 00000 en 00001 zijn de eerste twee rijtjes. 

Om na te gaan of een deelrij van a geoorloofd is, voeren we in 
het array 
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var getal: array[0..31] of boolean 


met als betekenis: als getal[i] de waarde true heeft, dan komt het 
rijtje met de waarde i al voor in het reeds gegenereerde deel van 
rij a. 


program bingetallen (output); 
var i: integer; 
orar artagló,. 35] Of Dyt) 
getal: array[0..31] of boolean; 
procedure binrij(k: integer); 
var j,h,l: integer; 
begin j := 0; 
while j <= 1 do 
begin h := alk-4] + 16 + alk-3] +» 8 +alk-2] +4 + 
alk-i] * 2 + J; 


if not getal[h] 
— then begin getal[h] := true; alkl := j; 
if k < 35 then binrij(k+1) 
in else for 1:=0 to 35 do 


Te writelalll); 
getallhl ¿= false 
end; 
j := ERN 
end 
end; 
begin al0] := 0; al1l := 0; al2} ze Oj al3j]j-:= 03} ala4} :=:03 
alb] ze 14 
getal[0] := true; getall1] := true; 
for 1e 00 31 Q0 getal lil ¿= false; 
binrijb) Me 
end. ° 
Opmerking 


Dit probleem is, evenals het vorige, een bekend voorbeeld van 
backtracking. In dit geval gaat het om een specifiek geval van een 
algemener probleem. Het algemenere probleem luidt: Gegeven de 
getallen 0,1,2,...,a-1. Plaats a van deze getallen in een cirkel, 
zodanig dat alle a? rijtjes van n opeenvolgende getallen verschillend 
zijn. 

Rijtjes die aan deze probleemstelling voldoen, worden De Bruyn- 
rijtjes genoemd. Het aantal van dit soort rijtjes bij de algemene pro- 
bleemstelling is 


n-1 4 
(a!)? 92 
AIT are (in ons voorbeeld: 4+ = 2 

sia D 

a 2 è 
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De pre- en de posteonditie (en de invariante relatie) van de proce- 
dure binrij zijn nu weggelaten; ze voldoen aan het algemene patroon. 
De arrays a en getal zijn globaal; we hadden ze ook als parame- 
ters kunnen opnemen. In de preconditie moet de vulling van getal 

ook worden beschreven. 


Voorbeeld 3 


Er wordt gevraagd alle mogelijkheden te genereren waarop er r 

(1 <r < n) verschillende getallen geselecteerd kunnen worden uit 
de getallen 1,2,3,...,n (de combinaties van r uit n). Het aantal 
mogelijkheden is 


Mis n! 
Cp? — r!(n-r)! * 


Het standaardalgoritme dat alle rijtjes xj X92... xp van getallen uit 
1,2,3,...‚n genereert, kan natuurlijk toegepast worden. We zouden 
er hierbij aan moeten denken dat twee rijtjes voor het probleem gelijk 
zijn als het ene rijtje een permutatie is van het andere rijtje. Als de 
combinaties echter in lexicografische volgorde gegenereerd worden 
geldt voor elk rijtje xj <xj+j (1 si <r). Bovendien weten we dat, 
als we al beschikken over het deelrijtje xj X92... Xj-], we voor het 
vinden van een waarde voor xj alleen die waarden hoeven te probe- 
ren die groter zijn dan xj_j en ten hoogste gelijk zijn aan n-r +i (er 
moeten immers nog r-i x-en een waarde kunnen krijgen). We zullen 
het standaardalgoritme daarom in aangepaste vorm gebruiken. 


program combinaties(input,output); 
type opl = arrayl0..25] of integer; 
var n,r: integer; 
a opl; 
procedure comb(k,n,r: integer; var x: opl); 
vat j: integer; 
begin x[k] := x[k-1] + 1; 
{inv. : alle voortzettingen tot geoorloofde rijen van 
x[1],... x[k-1],v met x[k-1]+1 < v< x[k] zijn 
gegenereerd en rijen ter lengte r zijn afgedrukt} 
while x[k] <= n-r+k do 
begin if k < r then comb(k+1,n,r,x) 
R else for j := 1 to r do writelx[jl); 
x[k] := x[k] + 1 IE A R 
end 
end; Ee 
begin y[0] := 0; 
{om ook y[1] op standaardmanier een waarde te geven} 
read(n); read(r); {1 <r < 25 < n} 
comb(1,n,r,y) 
end. 


We zijn er in het programma van uitgegaan dat de in te lezen waarde 
van r niet groter zal zijn dan 25. e 
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2.3 HET VINDEN VAN ÉÉN OPLOSSING 


In de voorbeelden tot nu toe ging het om het genereren van alle 
rijen met een bepaalde eigenschap. Backtracking kan echter ook 
gebruikt worden om één oplossing te vinden. Er kan dan met het 
doorlopen van de boom gestopt worden zodra er een oplossing 
gevonden is. De standaardprocedure wordt dan: 


procedure eenrij(k,n: integer; var q: boolean; var x: oplossing); 
{pre: de subrij x1 X2 bes Miet On geoorloofd en vastgelegd 
post: q = (er is een geoorloofde voortzetting van Xj X? .…. Xk-1 
gevonden en vastgelegd) } 
var i: integer; 
begin ds 1; q te DALSGI 
{q = (oplossing gevonden en vastgelegd) } 
while (not q) and (i <= m) do 
begin 'selecteer if element van X als waarde van xk'; 
if 'X1X2..-Xķ-1Xķ is geoorloofd’ 
{xk is ie element} 
then begin 'leg xyx2...Xk vast als geoorloofd! 


ei hd: 
then begin eenrij(k+1,q,x); 
if not q 
then ‘verwijder 
vastlegging" 
end 
else q := true 
end; 
iss iel T 


end 
end 


Voorbeeld 4 De paardesprong 


Gegeven is een 'schaakbord' met de afmeting n * n. Een paard 
wordt op een van de velden geplaatst. Gevraagd wordt of het paard 
(met de volgens het schaakspel toegestane zetten) alle velden van 
het schaakbord precies één keer kan bereiken (dus in n?-1 zetten). 
Als het mogelijk is willen we van elk veld weten bij welke zet het 
bereikt is, waarbij de telling bij 1 begint voor het veld waarop het 
paard geplaatst is. 

Een oplossing voor een 5 * 5 bord is: 


25 23 9 l4 3 
0 pao 9 
Di 26 19 4€ i3 
Ee o T E 

L 20 IT r g 
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We zullen het bord representeren door: 


var b: array[1..n,1..n] of integer; 


b[i,j] =p wil zeggen dat veld (i,j) bereikt is bij zet p. 

Een paard kan, vanuit het huidige veld, 8 verschillende velden 
bereiken (tenminste als ze alle 8 binnen het bord liggen). We num- 
meren deze 8 mogelijkheden en voeren in: 


var x,y: arrayl1..8] of integer; 


x[i] en y[i] geven de waarden aan die bij de eerste respectievelijk 
tweede waarde van het paar, dat het huidige veld aangeeft, moeten 
worden opgeteld bij de ie zet (uit de 8 mogelijkheden) om het paar, 
dat de nieuwe plaats aangeeft, te berekenen. 


program paardesprong(output); 
const n = 5; nkw = 25; 
type index = 1..n; 
var i,j: integer; 
succes: boolean; 
b: array[index, index] of integer; 
x,y: array[1..8] of integer; 
rocedure paard(k: integer; a,z: index; var q: boolean); 
{pre: het veld (a,z) is bij zet k-1 bereikt A (betekenis b) 
post: q = (er is een geoorloofde rij ter lengte nkw gevonden en 
vastgelegd in b} 
var j,r,s: integer; 
begin j := 1; q := false; 
{inv.: q = (er is een geoorloofde rij ter lengte nkw, als voortzetting 
van de beginsituatie met voor zet k de waarde w, 1 <w < j)} 
while (not q) and (j <= 8) do 
begin r := atxljl; s := z+yl jl; 
if (1 <= r) and (r <= n) and (1 <= s) and (s <= ñ) 
then if b[r‚s] = 0 
then begin b[r,s] := k; 


if k < nkw 
— then begin paard(k+1,r,s,q); 
if rot q then b[r‚s] := 0 
ENE 
else q := true 
end; 
j := jel Katan 
end 
end; 
begin x[1] s= 2; yli] := 1; x[2] := 1; y[2] := 2; x[3] := -1; y[3) := 2; 
x[4] := -2; yl[4] := 1; x[5] := -2; y[5] := -1; x[6] := -1; y[6] := -2; 
x[7] := 1; y[7] := =2; x[8] := 2; y[8] := -1; 
for i := 1 to n do for jer l ton do bli, j} := 0; 
read(i,j); 
bli,jl := 1; 


paard(2,i,j,succes); 
if succes 
then for i := 1 ton do begin for j := 1 ton do write(bli, jl); 
writeln 
end 
end. 
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Het array b (voor de oplossing) 


is als globale variabele voor de pro- 


cedure genomen. We zouden ook een parameter hiervoor hebben 


kunnen gebruiken. 


Voorbeeld 5 Eén oplossing voor het 8-koninginnenprobleem 


program achtkoninginnen2(output); 
var l: integer; 
“succes: boolean; 
ko: arrayl[1..8] of boolean; 
dl: array[2..16] o of boolean; 
dr: arrayl- -7..7] of boolean; 
rij: array[1..8] of 1..8; 


procedure koninginnenrij(k: integer; var q: boolean); 


VAE Ji 
begin j 


integer; 
JE g 


= false; 


while (not ST and (j <= 8) do 
begin i if kol jl and ar[k-j] and dl[k+j] 


then begin rijlk] := js 
ko[j] := false; dr[k-j] := false; 
dl[k+j] := false; 
if k <8 
then begin koninginnenrij(kt1,g); 
if not q 
then begin kolj] := true; 
dr[k-j] := true; 
dl[k+j] := true 
end 
end 
else q := true 
end; 
j := jl 
end 
es o 
begin for l := 1 to 8 do koll] := true; 
for I r 2 to 16 do dl[l1] := true; 
for 1 := -7 t to 7 do dr[1] := true; 


koninginnenrij(1, succes); 
if succes then for 1 


end. 


De relaties zijn hier weggelaten, 


1 to 8 do write(rijll]) 


ze voldoen aan de standaard; boven- 


dien lijken ze veel op die van het probleem van het genereren van 
alle oplossingen voor de 8 koninginnen. De variabele rij is globaal.e® 


24 DE NIET-RECURSIEVE VERSIE VAN 


BACKTRACKING 


Het backtrackingprobleem kan ook niet-recursief worden opgelost. 


il dit geval eN een repetitie 
Me hoda es «ll 


ervoor dat alle rijen xjXxg ...Xk met 


in de lexicografische volgorde worden doorlopen. 


* invariant voor deze repetitie is: 
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- Xk heeft een waarde (er wordt onderzocht of xjxg... xk een 
geoorloofde rij is); 


- KX... Xk-1 İs een geoorloofde rij; alle geoorloofde rijen die 
lexicografisch kleiner zijn dan xj... xk zijn gegenereerd; 


- de administratie, ten behoeve van het geoorloofd zijn, is bijge- 
houden. 


Als stoperiterium zouden we willen gebruiken: 'laatste rij onder- 
zocht'. Deze laatste rij is de rij met xj = X9 = ... = Xn =b met 
b = max(X). (Zoals bij de recursieve versie gaan we er weer van uit 
dat alle xj komen uit dezelfde X.) Omdat steeds van iedere rij de 
opvolger wordt bepaald en deze laatste rij geen opvolger heeft, 
moet geregistreerd worden dat de lexicografisch grootste (= laatste) 
rij onderzocht is. In voorkomende gevallen zal hiervoor een boolean 
variabele gebruikt worden, waarvan de betekenis aan de invariant 
toegevoegd wordt. 

Het algemene schema luidt: 


k s= 1} Xpee= min(X); {inv.: 'zie hierboven'} 
while ‘niet laatste rij onderzocht' do 
begin {rij xy X2 ...Xk-1 is geoorloofd} 
‘ga na of XyX2...Xp geoorloofd is'; 
if geoorloofd and (k < n) 
then begin "leg XIX... Xk vast als geoorloofd"; 
k := k+1; xp := min(X) 
end 
else begin if geoorloofd {and k = n} 
then ‘oplossing gevonden '; 
while (Xp = max(X)) and (k > 1) do 
begin k := k-l; ae 
‘verwijder xyXx5...Xp als geoorloofd' 


end; 
{xx Z max(X) or k = 1} 
if xk = max(X) then 'laatste rij onderzocht" 
Ee else Xx := SUCC(Xk) 
end 
end 


Voorbeeld 6 


We bekijken nog eens het probleem van de binaire getallen voorge- 
steld in een array (zie voorbeeld 2). We passen nu bovenstaand 
schema toe. 
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a[0] := 0; a[1] := 0; a[2] := 0; a[3] := 0; a[4] := 0; a[5] := 1; 
getal[0] := true; getal[1] := true; 
for i := 2 to 31 do getal[i] := false; 
al6] := 0; K := 6; laatste := false; 
{inv.: 'zie hierboven' A (Ai : O < i < 35 : getal[i] = 'i komt voor in a') 
A laatste = 'lexicografisch grootste rij onderzocht'} 


while not laatste do 
begin h := a[k-4] +» 16 + a[k-3] * 8 + a[k-2] * 4 + a[k-1] + 2 + afk]; 
if (not getal[h]) and (k <35) 
then begin getal[h] := true; k := k+1; afk] :=0 end 
else begin if not getal[h] 
then for i := 0 to 35 do write(alil); 
while (alk] = 1) and (k > 6) do 
begin k := k-1; 
h := alk-4] * 16 + alk-3] * 8 + 
+alk-2] * 4 +alk-1] * 2 + alk]; 
getallh] := false 


end; 
if alk] = 1 then laatste : 
else alk] := 1 


end 
end 


Opmerking 


In dit geval zouden we de boolean laatste niet behoeven te gebrui- 
ken. Waarom niet? © 


Voorbeeld 7 


We lossen nog een keer, maar nu op iteratieve wijze, het achtkonin- 
ginnenprobleem op (zie voorbeeld 1). 


for l := 1 to 8 do koll] := true; 
for l := 2 to 16 do dl[l] := true; 
for l1 := -7 to 7 do dr[1] := true; 
r := 1; rijl1] := 1; laatste := false; 
{inv.: rij[1..r-1] is geoorloofd en alle rijen die lexicografisch 
kleiner zijn dan rij[1..r] zijn gegenereerd, rij[r] heeft een 
waarde en in ko, dl, dr is de administratie bijgehouden A 
laatste = 'lexicografisch laatste rij onderzocht '} 
while not laatste do 
begin geoorloofd := kolrijlr]] and dr[rij[r]-r] and dllrijlrl+tr]; 
if geoorloofd and (r < KE 
then begin kolrijlr]] := false; arlrijlrl-rl : td 
Biteisiefeet := false; r := r+1; ebr 


end 
else begin if geoorloofd 
then for l := 1 to 8 do write(rijlll); 
while (rijlr] = 8) and (rT > 1) do 
begin r := r-1 
kolrijlrl] := true; 
dr[rijl[r]-r] := true; 
dl[rij[r]+r] := true 
end; 
if rijlr] = 8 then laatste := true 
else rijlr]l := rijflr]l+1 
end 


end 
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Voorbeeld 8 Het muntenprobleem 


Gegeven de 6 muntsoorten m[1], m[2], m[3], m[4], m[5] en m[6]; 
m[i] is de waarde van muntsoort i; m[1] > m{[2] > m[3] > m[4] > 
> m[5] > m[6]; m[6] = 1. Gegeven is ook een bedrag b > 0. 
Gevraagd worden alle manieren om bedrag b uit te betalen met de 
muntsoorten m[1], m[2], m[3], m[4], m[5] en m[6]. 
In plaats van de rijen xjxg...xg met xj * m[1] + Xə *m[2] +.. 
. +x *m[6] =b kunnen we als oplossingen nemen de rijen 
X] X9%...X5 met xj *m[1] + x2 x m[2] +... +x5 *m[5] <b omdat 
het eventueel ontbrekende deel van het bedrag b met de eenheden 
(m[6]) is aan te vullen. Als van de geoorloofde deelrij xj X9 ...Xk-1 
bijgehouden wordt 


som = X] * m[1] + Xo * EA R aN; a S * m[k-1] , 


dan komen als mogelijkheden voor xy, alleen in aanmerking: 
0,1,2,...,(b-som) div m[k] . 
In dit geval geldt altijd dat som + m[k] * x[k] < b en dus kan deze 


test op het geoorloofd zijn weg; er worden alleen geoorloofde rijen 
gegenereerd. 


(som = xm, + XM din F 


60 Voortgezet programmeren 


Voor alle deelrijen gelden nu verschillende mogelijkheden tot voort- 
zettingen. 


som s= 0} k s= 1; xil] := 0; laatste := false; 
{inv.: som s:x[1] * mil +. ERIKA A nikel A 

x[1..k-1] is geoorloofd A alle rijen, lexicografisch 

kleiner dan x[1..k-1] zijn gegenereerd A 

laatste = 'lexicografisch grootste rij is onderzocht '} 
while not laatste do 

begin if k< 5 
then begin som := som + x[k] > m[k]; 
Kk ser ktl; x[k] := 0 


end 
else begin for $: 1 tot3 do write- (xlil); 
writeln(b - som - x[k] +» m[k]); 
while (x[k] = (b - som) div m[k]) and (k > 1) do 
begin k := k-1; TEN TEET a 
som := som - x[k] * ml[k] 
end ; 
if x[k] = (b - som) div m[kl] 
“then laatste := true 
else x[k] := x[k]+1 
end 
end We ® 


In het algemeen geldt dat voor de xj een element wordt gekozen van 
een verzameling X en dat met de boolean geoorloofd wordt vastge- 
legd of dit element mag worden gekozen (of xjx3... xk nog consis- 
tent is met P). In het voorbeeld hierboven is er voor elke deelrij 
X1X2...Xk-1 een verschillende X. Deze X is zodanig dat xjxg.. 
……Xk-1Xk met xk EX consistent is met P. Algemeen geldt dat we de 
vrijheid hebben om een grote X te kiezen waarbij de niet in aanmer- 
king komende elementen van X via de boolean geoorloofd gedetec- 
teerd worden. We proberen echter meestal de kleinste X te kiezen 
zodat het aantal slagen in de repetities beperkt kan worden. (In het 
voorbeeld hebben we de kleinst mogelijke X gekozen.) 


2.5 HET VINDEN VAN EEN OPTIMALE OPLOSSING 


Een veel voorkomend probleem bij het genereren van rijen is het 
vinden van die rij die in een bepaalde zin optimaal is. Als we nu op 
een deelrij stuiten waarvan duidelijk is dat die door uitbreiding niet 
kan leiden tot een rij die het huidige optimum verbetert, dan heeft 
het geen zin die deelrij uit te breiden. In termen van het algemene 
backtrackingprobleem komt het erop neer dat we de eis P uitbreiden. 
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Voorbeeld 9 Het muntenprobleem 


In voorbeeld 8 werd gevraagd naar alle mogelijkheden om met de 
gegeven munten het bedrag b te vormen. Er wordt nu gevraagd 
naar die oplossing waarbij het totale aantal gebruikte munten mini- 
maal is. Er wordt dus naar de rij xj Xx9...xg gevraagd, waarvoor 
X] *X9 +... + x minimaal is. 

We vinden de oplossing door het algoritme uit voorbeeld 8 uit te 
breiden. Als extra variabelen introduceren we: 


me SEAN EREN toner akker ld 

- y[1..6]: de minimale oplossing onder alle rijen die gegenereerd 
zijn 

= min = y[1] + y[2] +... + y[6] 


Deze betekenis wordt aan de invariant toegevoegd. 

We zullen y en min initialiseren op de 'intuitieve oplossing': neem 
eerst zoveel mogelijk munten van de grootste muntsoort, daarna zo- 
veel mogelijk munten van de op één na grootste muntsoort, enzo- 
voort. (Vraag: Wanneer is deze intuitieve oplossing ook de uiteinde- 
lijke oplossing?) We nemen dus: 


y[1] =b div m[1], y[2] = (b-y[1] * m[1]) div m[2], … 
en 
min =y[1]+y[2] +... +y[6]. 


{initialiseren op intuïtieve oplossing: } 
k := 1; rest := b; min := 0; 
{inv.: rest =b = (Si: 1 S:í < k xli] * m[il) A 
min SE: End ket yik)? 
while rest > 0 do 
begin y[k] := rest div m[k]; min := min + y[k]; 
rest := rest mod m[k]; k := k+1 
end; 
{deze repetitie eindigt want m[6] = 1, dan geldt rest = 0 en 1 Sk < 7} 
for i := k ton do yli] := 0; 
{einde initialisatie} 
som := 0; laatste := false; 
k lxt i] := 0} 
a := 0; {a= (Si: 1sis<ke:x[i}l)} 
while not laatste do 
begin if (k < 5) and (a + x[k] < min) 


then begin som := som + x[k] #* mk]; 
a:s=a+x[k]; 
k := k+1; x[k] := 0 


end 
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else begin if a + x[k] < min 
then begin hulp := a +x[5] + (b-som-x[5]2m[5]); 
if hulp < min 
then begin min := hulp; 


for i := 1 to 5 do ġfi]:= x[i]: 
y[6] := b - som -x[5] +» m[5] 


end 
end; SAF 
while (x[k] = (b- som) div m[k]) and (k > 1) do 
begin k := k-1; dari Ek ela 
som := som - x[k] + m[k]; 
a := a-x[k] 
end; 
if x[k] = (b- som) div m[k] 
then laatste := true 
else x[k] := x[k]+1 
end 
end; B 
for i := 1 to 6 do write(ylil) 


Backtracking komt overeen met het op een systematische manier 
doorlopen van een boom. De boom is tot stand gekomen door de ele- 
menten van een verzameling in de lexicografische volgorde te plaat- 
sen. In het algemeen wordt de manier waarop we de boom bij back- 
tracking doorlopen de depth-first zoekmethode voor bomen (in het 
algemeen voor grafen) genoemd. Er is een tweede systematische 
manier om een boom (een graaf) te doorlopen, dat is de breadth- 
first volgorde. Als we de boom van bladzijde 46 nemen, betekent 
deze volgorde het doorlopen van de boom volgens: 1,2,3,11, 12,13, 
21,...,333. Ook nu kan er afgekapt worden als bij een bepaalde 
deelrij voortzetting geen zin heeft omdat de rij niet kan worden uit- 
gebreid tot een rij uit de oplossingsverzameling. Het op deze manier 
genereren van een superset wordt de branch-and-bound methode 
genoemd. 


2.6 OPGAVEN 


1. Gegeven een schaakbord van 4 * 4 velden. 


a. Gevraagd een programma te ontwerpen dat alle configuraties 
van 4 lopers genereert, zodanig dat: 
- alle lopers in verschillende rijen staan; 
- ze elkaar niet aanvallen (een loper op een veld V valt alle 
velden aan op de twee diagonalen door dat veld V). 


b. Gevraagd een programma dat alle configuraties van 4 lopers 
genereert zodanig dat ze elkaar niet aanvallen (nu mogen 
lopers wél in dezelfde rij staan). 
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2. Gegeven zijn twee natuurlijke getallen n en k. Gevraagd wordt 
een programma dat alle rijen aj,...,ak genereert waarvoor geldt: 


- (Ai: 1si<sk:ąa 2 0 en geheel) 
SAKS KEN B Bet 
Ser ES ISN: aj) = 


3. Gegeven is het natuurlijke getal n. 
Genereer een rij ter lengte n, bestaande uit elementen van de 
verzameling {1,2,3}, waarvan geen enkel paar aangrenzende 
deelrijen gelijk is. 


4. We noemen een natuurlijk getal a een prefix van een natuurlijk 
getal b als de decimale representatie van a uit die van b verkre- 
gen kan worden door aan de achterkant van b nul of meer cijfers 
weg te laten. Zo zijn bijvoorbeeld 2, 24 en 247 prefixen van 247. 
Maak een procedure die alle natuurlijke getallen kan genereren 
waarvan de decimale representatie de cijfers 1 t/m 9 precies één 
keer bevat en waarvan elke prefix deelbaar is door het laatste 
cijfer van de prefix. 


5. De variabele 
var k: arrayll..n,l..nl of integer 


heeft een waarde (n is een constante 2 1). 

Er moeten n karweien opgeknapt worden door n mensen. De kos- 
ten om karwei j door persoon i te laten opknappen bedragen 
k[i,j]. 

Schrijf een algoritme dat die toewijzing van de n karweien aan de 
n personen bepaalt waarvoor geldt dat de totale kosten minimaal 
zijn. 


6. Het elektriciteitsnetwerk bestaat uit een aantal onafhankelijke 
groepen G1,G2,...,Gm.» In het bedrijf moeten n gebruikers op 
deze groepen worden aangesloten. De vermogens die deze gebrui- 
kers opnemen zijn: P1,P92,...,Pp. Gevraagd wordt de n gebrui- 
kers zodanig over de m groepen te verdelen dat het maximale 
vermogen over de groepen minimaal is. (Bij elke verdeling van de 
gebruikers over de groepen is er een groep die het grootste ver- 
mogen moet leveren. Gevraagd wordt die verdeling waarbij dit 
grootste vermogen ten hoogste gelijk is aan de grootste vermogens 
bij alle andere verdelingen.) 

n en P1,P2,...,Pp en m zijn gegeven (geheel, > 0). Probeer te 
vermijden om verdelingen die permutaties van elkaar zijn, allemaal 
te genereren. 
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Gegeven is het tweedimensionale array 


var afstand: arrayl1..10,1..10] of integer 


afstand[j,i] voor alle i, 1< i< 10, 
0 voor alle i, afstand[i,j] 2 0 voor 


waarvoor geldt: afstand[i,j] 
en j, 1< j <10; afstand[i,i] 
alle i en alle j. 

Genereer de rij X1X2X3 ...X10 waarvoor 


afstand[x,‚x9] + afstand[x‚‚x] Reset afstand[xg,X,0) + 
+ afstand[x 10 X4] 


minimaal is (xj €{1,2,...,10}). 


. Een doolhof is gegeven door een waarde van 


var doolhof: array[1..m,1..n] of (vrij,bezet) 


De plaats van een muis in het doolhof is gegeven door het paar 
(p‚q) met 1 sp s men l sq <n. De plaats van een stuk kaas 
is gegeven door het paar (s‚t) met 1<s smenlst sn. 
Gegeven is dat er een weg is in het doolhof van de muis naar de 
kaas. Een weg bestaat uit array-elementen die paarsgewijs buren 
zijn; doolhof[i,j] en doolhof[k‚l] zijn buren indien (k = i+1 of 

k =i-1 en l = j) of indien (l =j-lofl=jtlenk =i). 

Bepaal een kortste weg die de muis moet afleggen om bij de kaas 
te komen. Het gaan van plaats (a,b) naar (c,d), waarbij (a,b) 
en (c,d) buren zijn, geeft een toename van de lengte van de weg 
met 1. 


. De variabelen 


var x: array[i..n] of integer 
G: integer 


hebben een waarde (n 2 1), zodanig dat voor alle i geldt x[i] > 0 
en G 2 0. 

Bepaal alle combinaties van x[i}en waarvan de som gelijk is aan G. 
('sum of subsets' probleem) 


Veronderstel dat n elektrische componenten op een printplaat 
moeten worden geplaatst, waarop n plaatsen beschikbaar zijn. 
Het aantal verbindingen tussen elk tweetal componenten is gege- 
ven in een verbindingsmatrix CONN, en de afstanden tussen elk 
tweetal plaatsen op de printplaat is gegeven in een afstandsma- 
trix DIST. Deze gegevens zijn vastgelegd in: 
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var n: 1..maxint; 
CONN: arrayll..n,1..nl of integer; 
DIST: arrayl1..n,l..nl of real; 


Deze variabelen hebben een zodanige waarde dat 


CONN[i,j] = CONN[j,i] = het aantal verbindingen tussen 
component i en component j 


DIST[r‚s] = DIST[s,r] = afstand tussen plaats r en plaats s. 


De bedrading van een printplaat bestaat uit het plaatsen van elk 
van de n componenten op een van de n plaatsen op de print- 
plaat, en het leggen van de benodigde verbindingen. De kosten 
van de bedrading zijn gelijk aan de som van de produkten van 
CONN[i,j] en DIST[r‚s] als component i op plaats r en component 
j op plaats s is geplaatst. 

Gevraagd wordt een bedrading te bepalen waarvan de kosten 
minimaal zijn, en deze minimale kosten. 


11. De variabelen 


var g,p: arrayl1..nl of integer; 
G: integer; 


hebben een waarde (n 2 1). Voor alle i geldt gli} > 0 en p[i] > 0; 
ook geldt G > 0. 
Geef de variabele 


var X: arrayll..nl of 0O..1; 


een zodanige waarde dat 
(Sk: Ls isme gh tdp-siG 
en 
(Si: 1sisn: p[i] +» x[i]) maximaal is. 
(knapzakprobleem) 
12. De waarden van de muntsoorten 1 t/m n worden voorgesteld door 
de rij W1,...,Wņ van positieve gehele getallen. Het aantal ver- 
schillende manieren waarop met voldoend grote aantallen van 


deze munten een bedrag b (b 2 0) gevormd kan worden, wordt 
aangeduid met A(b,n). 


a. Leid voor A(b,n) een recurrente betrekking af. 
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b. Geef de specificatie en de code van een recursieve procedure 
die bij gegeven b, n, W1,...,Wņp de grootheid A(b,n) bepaalt. 


c. Breid deze procedure zodanig uit dat tevens een oplossing 
met een minimaal aantal munten bepaald wordt. 


13. Een fabriek produceert een bepaalde stof waarvan de kleur en 
de viscositeit belangrijk zijn. De geproduceerde stof komt in 
containers op een terrein te staan. Van iedere container wordt 
de kleur en de viscositeit gemeten. De kleur wordt aangegeven 
met een getal uit het bereik 1 t/m 99. De viscositeit wordt aan- 
gegeven met een getal uit het bereik 1 t/m 25. De stof wordt 
naar de klant getransporteerd in tankwagens waarin de inhoud 
van 5 containers gaat. De klant eist dat de kleur van het meng- 
sel ten minste 40 en ten hoogste 60 is. De fabrikant wil de con- 
tainers, waarvan de inhoud de laagste viscositeit heeft, het 
eerst afleveren. Dit betekent dat de som van de viscositeitsge- 
tallen zo laag mogelijk moet zijn. 

Gegeven zijn: 


type nummer = 1..1000000; 
type kleur = 1..99; 
type viscositeit = 1..25; 
type container = record nr: nummer; 
kl: kleur; 
vis: viscositeit 


end; 
var terrein: array [1..1000] of container; 
al: 5. „1000; 


De variabelen terrein en ac hebben een waarde en stellen voor 
de containers op het terrein en het aantal containers. De varia- 
bele terrein is zodanig gevuld, dat alle aanwezige containers 
staan geregistreerd in terrein[1..ac]. 

Gevraagd een algoritme dat als resultaat geeft: 


- als er een vijftal containers aanwezig is waarvan de gemiddelde 
kleur minimaal 40 en maximaal 60 bedraagt, dan dienen de vari- 
abelen : 


var mogelijk: boolean; 
vijftal: array[1..5] of nummer; 


als waarden te krijgen: true en de nummers van dat vijftal 
waarvan de som van de viscositeitsgetallen zo laag mogelijk is; 


- indien er niet een dergelijk vijftal aanwezig is, krijgt de vari- 
abele mogelijk de waarde false. 


3 EFFICIËNTIE VAN ALGORITMEN 


3.1 ANALYSE VAN ALGORITMEN 


We analyseren algoritmen om ze, waar mogelijk, te verbeteren en om 
tussen verschillende algoritmen voor hetzelfde probleem een keuze 
te kunnen maken. We gaan ervan uit dat de algoritmen correct zijn 
en bij verbetering correct blijven. 

Criteria bij de waardering van een algoritme kunnen zijn: de hoe- 
veelheid tijd en de hoeveelheid geheugenruimte die het algoritme bij 
uitvoering vraagt. We zullen ons hier voornamelijk bezighouden met 
de tijd. Wat de geheugenruimte betreft worden algoritmen vergeleken 
op grond van de extra geheugenruimte die het algoritme vraagt. Hier- 
bij kan gedacht worden aan het aantal enkelvoudige variabelen en 
het aantal en de aard van de componenten van samengestelde varia- 
belen. Tot de extra geheugenruimte wordt ook die ruimte gerekend 
die gebruikt wordt om de invoer 'beter verwerkbaar! te represente- 
ren. Als de extra geheugenruimte constant is ten opzichte van de 
omvang van de invoer, dan zegt men wel dat het algoritme 'in situ! 
is. Dit geldt bijvoorbeeld ten aanzien van een sorteeralgoritme dat 
de waarden in een array sorteert en daarbij enkele hulpvariabelen 
gebruikt waarvan het aantal onafhankelijk is van de grootte van het 
te sorteren array. 

Voor de hoeveelheid tijd willen we niet de verwerkingstijd, bij- 
voorbeeld in seconden, van het algoritme gebruiken, omdat deze tijd 
afhankelijk is van de programmeertaal, de vertaler en de machine. 
Het gaat in eerste instantie niet om de 'echte' tijd, maar om een maat 
(een eenheid) om algoritmen te kunnen vergelijken. Wel moet deze 
maat een indicatie opleveren voor de ‘echte! tijd. We willen een maat 
die ons iets zegt over de efficiëntie van de in het algoritme gebruikte 
methode. Vaak kan in een algoritme een 'typische!' operatie onder- 
scheiden worden. Voor een zoekalgoritme in een array zal dit het 
vergelijken zijn van de gezochte waarde met een element van het 
array, voor een algoritme voor het vermenigvuldigen van twee 
matrices zal dit het vermenigvuldigen van twee matrixelementen zijn 
(en eventueel het optellen). We baseren onze maat op zo'n soort 
operatie. De gekozen operatie moet natuurlijk representatief zijn 
voor het gedrag van het algoritme. We zullen de door het algoritme 
benodigde tijd uitdrukken in het aantal malen dat de gekozen basis- 
operatie wordt uitgevoerd. Dit aantal wordt de tijd-complexiteit van 
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het algoritme genoemd. De complexiteit van een algoritme heeft niets 
van doen met de ingewikkeldheid van het algoritme. Er zijn ingewik- 
kelde algoritmen met een kleine complexiteit. Door de gekozen maat 
kunnen natuurlijk alleen algoritmen vergeleken worden die dezelfde 
basisoperatie hebben. 


3.2 COMPLEXITEIT 


De complexiteit van een algoritme is veelal afhankelijk van de omvang 
en de aard van de invoer (de complexiteit is een functie van de 
invoer). We kunnen ons losmaken van de aard van de invoer door te 
kijken naar het gemiddelde gedrag van een algoritme. Laat Vn de 
verzameling zijn van alle mogelijke invoeren ter grootte n voor het 
algoritme. Laten we een element van Vp aangeven met i. De kans dat 
invoer i optreedt binnen het geheel van mogelijke invoeren geven we 
aan met p(i) en het aantal basisoperaties dat bij invoer i nodig is 
met t(i). Het gemiddelde gedrag, de gemiddelde complexiteit (aver- 
age complexity), bij een invoer van grootte n, kunnen we dan defi- 
niëren als 


Aln =F epay RES 
iEV 


Deze gemiddelde complexiteit is vaak moeilijk te bepalen. De t(i) kan 
nog wel bepaald worden voor alle i, maar de p(i) wordt meestal op 
grond van ervaring of 'met een natte vinger! bepaald. Daarom wordt 
vaak gewerkt met de complexiteit voor het slechtste geval (worst 
case complexity). De voor het algoritme meest ongunstige aard van 
de invoer wordt genomen en er wordt gekeken wat bij deze invoer 
de complexiteit is. We definiëren deze complexiteit als 


W(n) = max (t(i)) 
iEV 


W(n) legt de bovengrens vast van de complexiteit van een algoritme 
bij een invoer van grootte n. 


Voorbeeld Het zoeken in een (ongesorteerd) array naar de waarde x 


Voor het bepalen van A(n) moet er onderscheid gemaakt worden tus- 
sen de gevallen dat bekend is dat x voorkomt in het array en dat 
niet bekend is of x voorkomt in het array. Beide gevallen leveren 
een resultaat dat lineair is in n, maar ze zijn niet gelijk. Het is dui- 
delijk dat W(n) =n. hd 
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Voorbeeld Het vermenigvuldigen van twee n * n matrices 


We nemen hiervoor het rechttoe-rechtaan algoritme: 


for i := 1 ton do 
for j := 1 to n do 
<s begin cfs, j] := 0; 
for k := 1 ton do 
Gli j s= eli,jl + ali,kl 4 blk;jl 
end 


Er geldt W(n) = A(n) = n°. Het algoritme is onafhankelijk van de 
aard van de invoer (als het maar te vermenigvuldigen waarden zijn). © 


We kunnen W(n) als volgt interpreteren. Bij uitvoering van het 
algoritme worden er in het slechtste geval C * W(n) operaties uitge- 
voerd en de benodigde 'echte' tijd is C' * W(n), waarin C en C' con- 
stanten zijn die bij het vergelijken van algoritmen niet van belang 
zijn. Uit het bovenstaande blijkt bovendien dat W(n) en A(n) moei- 
lijk te bepalen kunnen zijn, vooral A(n) omdat daar een kans een 
rol in speelt. Om de twee zojuist genoemde redenen wordt bij be- 
schouwingen over complexiteit vaak gebruik gemaakt van een speci- 
ale notatie. We zeggen dat W(n) van de orde g(n) is, W(n) = O(g(n)), 
als er positieve constanten c en N zijn zodanig dat voor alle n 2 N 
geldt W(n) < c *g(n). De W(n) van het zoekalgoritme is O(n), van 
het matrixalgoritme O(n®). Als W(n) = (n+1)?, dan geldt voor W(n): 
O(n?). Zo geldt voor een W(n) =n? + 5n? + 7: O(n?); volgens de 
definitie geldt voor deze W(n) ook O(n*), maar dit is een zwakkere 
uitspraak. De notatie f(n) = O(g(n)) wordt ook wel gebruikt voor 
mn f(n)/g(n) =C (#0). Wij zullen de eerder gegeven definitie 
hanteren en geven met f(n) = O(g(n)) de sterkste uitspraak aan die 
we kunnen doen over de orde. 


Voorbeeld Het zoeken in een array ter lengte n 


Als het array niet gesorteerd is zal het zoeken moeten gebeuren met 
een lineair zoekalgoritme: 


dar Ar AAV tE HE nva deet... ter} 
while (x <> al il) and li < n) do i := itl; 


if x= alil then k := i else k := 0 


Voor dit algoritme geldt W(n) = A(n) = O(n). 
Als het array gesorteerd is kan het binaire zoekalgoritme toege- 
past worden: 
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s= n 
Clavis RA Sm weal ier € alln) 
while i < j do 
begin m := (i+j) div 2; 
if x> alae 
< then i := mèl 
else j := m 


end; 
if x = alfil then k : 


1ielse k := 0 


Voor dit algoritme geldt W(n) = A(n) = O(log n). o 


Heeft het zin om het array eerst te sorteren en daarna te zoeken 
naar de waarde x? Sorteren vergt een algoritme waarvoor geldt 
W(n)z2 O(n * log n) (zie bij sorteren). Eerst sorteren en daarna 
zoeken heeft dus geen zin, tenzij er niet één keer gezocht moet wor- 
den, maar vele malen. Dan heeft het zin het array in een speciale 
vorm te brengen (gesorteerd). 


Zo'n speciale vorm van een array ten behoeve van het zoeken is ook 
de hashtabel. De waarde x moet gezocht worden in een collectie V 
van n waarden. Stel dat we een functie f kennen, de zogenaamde 
hashing functie, die voor elke waarde w uit de collectie V een func- 
tieresultaat oplevert in 1..n. We kunnen dan de n te doorzoeken 
waarden van de collectie V verdelen over n rijtjes, elk rijtje geasso- 
cieerd met een van de waarden 1..n, waarbij elke waarde w uit de 
collectie V wordt geplaatst in het rijtje dat geassocieerd is met f(w). 
De gemiddelde lengte van de rijtjes zal 1 zijn. Indien f een zoge- 
naamde uniforme hashing functie is - dat wil zeggen dat voor wille- 
keurige w de kans dat f(w) = i gelijk is aan 1/n voor alle i in 1..n - 
zal de lengte van elk rijtje ook ongeveer 1 zijn. 

Het zoeken van de waarde x in de collectie V komt nu neer op het 
zoeken van x in het rijtje dat geassocieerd is met f(x). Hebben we 
te maken met het ideale geval van de uniforme hashing functie dan 
geldt voor het zoekalgoritme W(n) = A(n) = O(1). De hashing functie 
zou zodanig kunnen zijn dat W(n) = O(n). Dit geval treedt op als 
voor alle w uit V de f(w) dezelfde waarde oplevert (en ook f(x) 
gelijk is aan deze waarde). Voor integer waarden levert de functie 
f(x) =x mod n over het algemeen een goed resultaat. 

De representatie van de n rijtjes kan op verschillende manieren 
gebeuren (we komen er later op terug). We kijken hier nu naar de 
representatie van de n rijtjes in één array. We noemen dit de hash- 
tabel. 

Een waarde w wordt in het array gezet op de plaats met index 
fw). Het kan natuurlijk zijn dat er een v en een w zijn met v # w 
waarvoor geldt f(v) = f(w). Als dan w al in het array geplaatst is, 
wordt v op de dichtstbijzijnde lege plaats met een index groter dan 
f(v) geplaatst (als we op deze wijze bij de grootste index komen 
wordt er verder gezocht naar een lege plaats vanaf index 1). Op 
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deze manier worden alle n waarden in het array geplaatst, waarbij 
het voordelig blijkt te zijn om hiervoor niet een array ter lengte n 
te nemen, maar een array met lengte m (> n). Er blijven dan 'lege! 
plaatsen over. Als algoritme voor het zoeken van x krijgen we dan: 


E = Elp Ae CAF Bleid < a al Aak) 


while (x<>alil) and (alil <> 'leeg') do i := i mod mt 1; 
if ali] = x then k := i else k := -1 


In de literatuur is veel bekend over resultaten van zoekalgoritmen. 
Zo bevat het boek van D.E. Knuth "Sorting and Searching" (deel 3 
uit de serie "The art of computer programming"; uitgever Addison- 
Wesley) een overstelpende hoeveelheid informatie over zoeken en 
sorteren in het algemeen, en dus ook over hashing. 

Als we voor ons geval n/m aangeven met a dan is bekend dat het 
gemiddeld aantal vergelijkingen in de repetitie voor het geval dat x 
voorkomt (1 + (1/(1-a)))/2 is, en voor het geval dat x niet voor- 
komt (1 + (1/(1-a)?))/2. Voor a = 4/5 is dit 3, respectievelijk 13. 
Er geldt A(n) = O(1). Maar ook geldt W(n) = O(n). Voor grotere 
waarden van n/m wordt het gemiddeld aantal slagen van de repetitie 
(snel) groter. 


In dit voorbeeld van het zoeken in een array hebben we verschillende 
algoritmen bekeken, die ook verschillende complexiteiten hebben. 

Het kan profijtelijk zijn om de invoer van een algoritme voor te 
bewerken om daarmee een sneller algoritme mogelijk te maken. Het 
hashing algoritme is bovendien een voorbeeld van het gebruik van 
extra geheugenruimte (niet constant) om daarmee een sneller algo- 
ritme mogelijk te maken. @ 


Bij het vergelijken van algoritmen vergelijken we de ordes van de 
algoritmen. Zo zeggen we dat binair zoeken sneller is dan lineair 
zoeken omdat het eerste algoritme O(log n) is en het tweede O(n). 
Door het vergelijken van de ordes zijn de constanten, zoals in: 'het 
aantal bewerkingen is c * n?', verdwenen. In sommige gevallen, en 
zeker bij kleine waarden van n, zullen we toch met deze constanten 
rekening moeten houden. Stel dat we vier algoritmen hebben voor 
hetzelfde probleem en dat er geldt: 


A(n) = 1000n, A(n) = 200n log n, A,(n) = 10n? en A(n) = pd 


Bij ordebeschouwingen zullen we zeggen dat het eerste algoritme 
gemiddeld het snelst is (de kleinste complexiteit heeft). Dit geldt 
echter alleen als n > 100 (en bij ordebeschouwingen wordt alleen. 
naar grote waarden van n gekeken). Het vierde algoritme zal bij 
ordebeschouwingen als slecht worden gekarakteriseerd ten opzichte 
van de andere drie, maar bijvoorbeeld voor n = 2 is het vierde algo- 
ritme het snelste. We komen op dit punt terug bij het onderwerp 
sorteren! in het volgende hoofdstuk. Voorlopig zullen we er echter 
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geen rekening mee houden en de algemene uitspraak hanteren dat 
een O(n)-algoritme sneller is dan een O(n?)-algoritme. 

Om enig idee te krijgen van de groeisnelheid van functies f(n) 
bekijken we enkele van deze functies en rekenen waarden hiervan 
om naar werkelijke tijden. We doen dit door als eenheid een micro- 
seconde te nemen; zo levert de functie f(n) = 100n? voor n = 1000 
op: 100 seconden. We geven twee tabellen. In de eerste tabel wordt 
bij een aantal groottes van de invoer en een aantal functies de hier- 
boven bedoelde werkelijke tijd gegeven. In de tweede tabel wordt 
bij een aantal werkelijke tijden en een aantal functies de maximale 
grootte gegeven van de invoer die mogelijk is voor een algoritme dat 
van de orde is van de opgegeven functie, om binnen de opgegeven 
tijd te eindigen. 


complexiteit 

1000n 0,02 see 0,05 sec 0,1 sec 0,2 sec 0,5 sec 1 sec 
1000n log n 0,9 sec 0,3 sec 0,6 sec 1,5 sec 4,5 sec 10 sec 
100n? 0,04 sec 0,25 sec 1 sec 4 sec 25 sec 2 min 
10n? 0,08 sec 1 sec 10 sec 1 min 21 min 2,7 uur 
n ogn 0,4 sec 1,1 uur 220 dag 125 eeuw 5108 eeuw 

2n/3 0,0001 sec 0,1 sec 2,7 uur 310% eeuw 

e 1 sec 35 jaar 3x10% eeuw 


58 min 2109 eeuw 


104 sec 106 sec 108 sec 
1 sec 10” sec (2,7 uur) (12 dagen) (3 jaar) 


complexiteit 


1000n 109 10° 107 10° 1011 
1000n logn (1,410? 7,7103 5,2105 3,9107 _ 3,1=10° 
100n? 102 103 104 10° = 108 
10n? 46 2,1*102 10° 4,6#103 2,1*10f 
„een 22 36 54 79 112 
nis 59 79 99 119 139 
ga 19 26 33 39 46 

En 12 16 20 25 29 


Bij de overgang van 10? naar 10* seconden in de tweede tabel neemt 
de maximale grootte van de invoer bij een complexiteit van 1000n toe 
met een factor 100, bij een complexiteit van 3? is deze factor slechts 
5/4. 
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Als de tijd die nodig is voor de uitvoering van de operatie, waar- 
op de complexiteit is gebaseerd, hebben we een mieroseconde geno- 
men. Stel nu dat we een machine hebben die 100 maal zo snel is, de 
operatie wordt uitgevoerd in 1078 seconden. Dan zal voor een algo- 
ritme met A(n) = 1000n gelden dat in dezelfde tijd nu een probleem 
opgelost kan worden met een invoer die 100 maal zo groot is als bij 
de ‘vorige! machine. Voor een algoritme met A(n) = 3} kan de maxi- 
male n ongeveer 4 groter worden (en bij realistische tijden nog 
steeds klein zijn). Het vergelijken van algoritmen wat hun complexi- 
teit betreft blijft dus zelfs bij supersnelle machines belangrijk. 

De backtracking algoritmen uit het vorige hoofdstuk zijn alleen 
realistisch bij kleine waarden van n, want er geldt dat deze algorit- 
men exponentieel zijn. 


In het voorgaande is de complexiteit als enig criterium genomen bij 
de beoordeling van algoritmen. Uit de tabellen blijkt dat de complexi- 
teit ook inderdaad een belangrijk criterium moet zijn. We komen er 
later nog op terug. Voor we daarmee verder gaan is het goed om ook 
enkele andere punten te noemen. Correctheid en geheugengebruik 
zijn al genoemd. Zaken waarmee ook rekening gehouden dient te 
worden zijn bijvoorbeeld: 


- Als een programma slechts een enkele keer gebruikt wordt (maar 
ook in andere gevallen kan dat zo zijn), zullen de kosten van het 
programmeren zwaarder wegen dan de kosten van de verwerking 
van het programma. 

Het is vooral voor een programma dat vaak gebruikt wordt belang- 
rijk dat het efficiënt is. 

- Als de grootte van de invoer voor het te ontwerpen algoritme 
altijd klein is, doet de complexiteit van het algoritme er niet zo 
veel toe. Bovendien kan een constante, die door de O-notatie is 
verdwenen, dan een overheersende rol gaan spelen. 

- Een belangrijke eigenschap van een algoritme is zijn eenvoud, 
zijn leesbaarheid. Programma's die gedurende langere tijd gebruikt 
worden, zullen in de loop der tijd vaak uitgebreid of aangepast 
worden. Dit stelt aan het programma de eis dat ook anderen dan 
de oorspronkelijke programmeur het programma moeten kunnen 
lezen en begrijpen. 

- In veel gevallen zijn tijd en geheugengebruik tegen elkaar inwis- 
selbaar. Een algoritme is vaak te versnellen door extra geheugen- 
ruimte te gebruiken en er kan vaak met minder geheugenruimte 
worden volstaan als we genoegen nemen met een verlies in de 
snelheid. 


Tot nu toe hebben we gesproken over complexiteit in relatie tot een 
algoritme. We kijken nu naar de complexiteit van een probleem. Hoe- 
veel operaties zijn er nu echt nodig om een bepaald probleem op te 
lossen? Weten we wat de complexiteit zou moeten zijn van het beste 
algoritme ter oplossing van het probleem? Neem het sorteerprobleem 
en neem als basisoperatie voor de algoritmen het vergelijken van 


14 Voortgezet programmeren 


twee waarden. Er zijn sorteeralgoritmen met deze basisoperatie met 
een complexiteit van O(n *log n). Kan het beter? We noemen een 
algoritme optimaal als er in de beschouwde klasse van algoritmen 
(algoritmen met dezelfde basisoperatie) geen beter algoritme te vin- 
den is. Als we de complexiteit van een probleem aangeven met F(n), 
dat is dus het minimaal benodigde aantal basisoperaties dat nodig is 
voor de oplossing van dat probleem, dan is een algoritme voor dit 
probleem optimaal als geldt: W(n) = O(F(n)). W(n) geeft voor een 
bepaald algoritme een bovengrens voor het aantal operaties, F(n) 
geeft een algemene ondergrens (voor alle algoritmen uit de klasse). 


Voorbeeld Het vinden van de maximale waarde in een ongesorteerd 


array 
max := all; 
dze 17 invit MemilMAK Se dis: d- sr desa jl} 
while i < n do ren 
begin i := i+1; 
if ali} > max then max := afi] 
end gen 


De basisoperatie is de vergelijking. Voor het algoritme geldt: 

W(n) = A(n) =n-1. Om de grootste waarde te bepalen moet er ver- 
geleken worden waarbij er n-1 waarden moeten afvallen om er één 
over te houden. Iedere vergelijking van twee waarden kan slechts 
één afvaller opleveren. Er geldt dus F(n) = n-1. Het bovenstaande 
algoritme is dus optimaal. e 


Voorbeeld Het vermenigvuldigen van twee n * n matrices 


Voor het eerder gegeven algoritme voor dit probleem geldt: W(n) = 
= A(n) =n. Kan het beter? Bekend is dat er ten minste n? verme- 
nigvuldigingen nodig zijn voor de oplossing van dit probleem. Niet 
bekend is of het ook echt met n? vermenigvuldigingen kan (niet 
bekend is of F(n) = n?). Er is een algoritme bekend waarvoor geldt 
W(n) = O(nlog 7). Dit is het algoritme van Strassen. Neem twee 

2 x 2 matrices A en B en laat C = A * B. Er geldt: 


C11 Sraa * 812P 


C91 7 831911 * a22 


b b 


21 Rip TRIT UO IG 


b b 


21 Cog = A919013 * 8379929 
Stel dat we de beschikking hebben over de waarden: 

X4 jr + Agg) * 11 + Bog) 

X = (Agy +899) * D11 


Xg = a11 * Dio P29) 
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Xe 7 (a21 7 811) * (b11 + B19) 
Xq = (ajg 7 a393) * (by, + bo) 

Dan kunnen we de elementen van C berekenen als: 
Cin Aera T SX Sia Kg TAg 


n ne | re Le Re ens 


We kunnen de produktmatrix dus berekenen met behulp van 7 ver- 
menigvuldigingen (en 18 optellingen) in plaats van de 8 van het 
rechttoe-rechtaan algoritme. 

Stel nu dat onze matrices n * n zijn, waarbij n een 2-macht is. 
We kunnen deze matrices opdelen in 4 submatrices en voor de ver- 
menigvuldiging gebruik maken van de zojuist getoonde methode. 
Voor het vermenigvuldigen van twee submatrices kunnen we weer 
hetzelfde procedé toepassen: opdelen in 4 submatrices en .... 
Laat n = 2K en laten we met M(k) het aantal vermenigvuldigingen 
aangeven voor twee n * n matrices. Er geldt dan: 


M(0) = 1 
M(k) = 7 x M(k-1) voor k > 0 


Uit deze recurrente betrekking volgt dat 


k log n 


M(k) = 75 (=7 log7 n2: 81 


=n ). ® 


Er zijn problemen waarvoor geen oplossing bestaat en er zijn vele 
problemen waarvoor efficiënte oplossingen bestaan. Dan is er nog 
een klasse problemen waarvoor wel algoritmen bestaan, maar deze 
algoritmen zijn zó inefficiënt dat ze eigenlijk geen praktische waarde 
hebben. Van een aantal van deze problemen is bekend dat er ook 
nooit efficiënte algoritmen voor kunnen worden gevonden. Voor 
andere problemen uit de bedoelde klasse is geen efficiënt algoritme 
bekend, en men verwacht ook niet dat er ooit een gevonden zal wor- 
den maar men is er niet zeker van. 

Wanneer is een algoritme inefficiënt? Een algoritme waarvan de 
orde een exponentiële functie (O(eh)) is, noemen we inefficiënt (zie 
de tabellen op bladzijde 72). Zo'n algoritme kan echter wel bruik- 
baar zijn voor kleine groottes van de invoer! Efficiënte algoritmen 
hebben een complexiteit die een polynoom is in n. Natuurlijk is er 
binnen deze klasse van algoritmen onderscheid te maken tussen meer 


76 Voortgezet programmeren 


en minder efficiënte algoritmen, maar zoals uit de eerder gegeven 
tabellen blijkt, zijn deze algoritmen - ook bij een wat grotere omvang 
van de invoer - van praktische waarde. Dit geldt niet voor de 'expo- 
nentiële algoritmen'. 

Van problemen waarvoor 'polynomische algoritmen! beschikbaar 
zijn, wordt gezegd dat ze tot de klasse P behoren. Er is ook een 
klasse die met NP wordt aangegeven (nondeterministisch polyno- 
misch). Het is de klasse van problemen waar - wat onnauwkeurig 
geformuleerd - voor geldt dat, als er een oplossing voor wordt gege- 
ven, het snel is vast te stellen of dit werkelijk een oplossing is 
(waarvoor een polynomisch algoritme is te vinden dat vaststelt of de 
voorgestelde oplossing een valide oplossing is). Dit houdt in dat P 
een deel is van NP. Maar tot NP behoren ook problemen waarvoor 
tot nu toe alleen exponentiële algoritmen bekend zijn, maar waarvan 
niet bewezen is dat ze niet tot P behoren. De naam NP voor deze 
klasse is gegeven door het feit dat deze problemen door een nonde- 
terministische algoritme in polynomische tijd zouden kunnen worden 
opgelost. Met nondeterministisch wordt bedoeld dat het algoritme 
zodanig is dat overal waar tijdens het oplossingsproces een keuze 
zou moeten worden gemaakt uit meerdere mogelijke voortzettingen (en 
normaal gesproken alle mogelijke voortzettingen geprobeerd moeten 
worden) het algoritme altijd die voortzetting kiest die tot de oplos- 
sing leidt. Zo'n algoritme heeft dus een soort orakel ingebouwd dat 
altijd de goede weg wijst. 

Er is een deelklasse van NP die NP-compleet wordt genoemd. 
Deze bevat die problemen uit NP, die de eigenschap hebben dat als 
er voor zo'n probleem een polynomische oplossing zou worden gevon- 
den, alle problemen uit NP dan een polynomische oplossing hebben. 
(En dan zouden de klassen P en NP samenvallen.) 


Niet-oplosbare 
problemen 


NP complete 


Problemen 


Efficiëntie 


3.3 BENADERDE OPLOSSINGEN; EFFICIËNTIE 


De backtracking-algoritmen hebben allemaal in principe een com- 
plexiteit die een exponentiële functie is. Het gaat steeds om het 
vinden van alle rijen of van één rij van de vorm xjx2..xn waarbij 
voldaan wordt aan een of andere eis P(X1X92 ...Xņ). Als voor de 
keuzeverzameling X (we gaan er weer van uit dat elke xj uit dezelfde 
verzameling X komt) geldt dat deze uit m elementen bestaat, dan is, 
als we alle rijen ter lengte n zouden genereren, het aantal mogelijk- 
heden ml. Bij backtracking proberen we een groot aantal rijen niet 
te genereren, maar daar staat weer tegenover dat we niet alleen 
rijen ter lengte n genereren, maar alle rijen ter lengte k met 

k = 0,1,2,...,n. Voor kleine waarden van n kunnen de backtracking- 
algoritmen wel van praktische betekenis zijn, voor grote waarden 
van n zijn ze het zeker niet. Voor grote n zullen we bij dit soort 
problemen een benadering voor de oplossing zoeken. Dit geldt vooral 
voor die problemen waar het erom gaat een rij xj Xg... Xn te vinden 
die in een of andere zin optimaal is. Een voorbeeld was het munten- 
probleem, waar het erom ging het bedrag b uit te betalen met zo 
weinig mogelijk munten. Als het vinden van de optimale oplossing in 
zo'n geval een complexiteit heeft die een exponentiële functie is, dan 
zijn we ook tevreden met een algoritme dat weliswaar niet de optimale 
oplossing levert, maar wel een oplossing die volgens een of ander 
criterium 'dicht in de buurt ligt' van deze optimale oplossing. 

Een bekend probleem met een exponentieel algoritme is het reizi- 
gersprobleem (traveling salesman problem). We bekijken hier de 
versie van het probleem en het benaderingsalgoritme zoals die gege- 
ven zijn door J.L. Bentley *). Het opnemen van dit voorbeeld heeft 
als bedoeling een benaderingsalgoritme te laten zien, maar ook om 
eens te kijken naar de kleine ingrepen in algoritmen in het algemeen, 
die bedoeld zijn om de efficiëntie van een bestaand algoritme te ver- 
beteren. 


Een mechanische plotter moet in duizend punten een merkteken 
plaatsen. Deze punten zijn in de invoer gegeven als duizend paren 
van x- en y-coördinaten. De (ideale) uitvoer is de rij van duizend 
punten xj X2 ... X100g in een zodanige volgorde dat de rij een mini- 
maal pad oplevert. (Een xj is dus een paar!) De lengte van het pad 
behorende bij de rij xj Xx2... X1000 İS 


ease Rr |) Za 000! 


waarbij |la-b| staat voor de afstand tussen de punten a en b. Als we 
dit minimale pad gevonden hebben, zouden we de plotter in de volg- 
orde van de bijbehorende rij kunnen aansturen. Zoals gezegd zullen 


‘mmm 


ORE, Bentley, Writing Efficient Programs, Prentice-Hall, 1982. 
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we niet het werkelijk minimale pad zoeken (wat bijvoorbeeld met 
backtracking zou kunnen), maar zijn we tevreden met een benade- 
ring. Zo'n benadering van een optimale oplossing wordt wel een 
heuristiek genoemd. Het programma luidt: 


program pad(input,output); 
const maxtps = ...; {maximaal aantal punten} 
type point = record x,y: real end; 
ptptr = 1..maxtps; en 
ptss = arraylptptr] of point; 
var numpts,i: ptptr; 
ptarr:s ptss; 
function afst(p,q: point): real; 
pre: true 
post: afst = |p-gl} 
begin afst := sqrt(sqr(p.x-gq.x) +sqr(p.y-gq.y)) end; 
procedure approxpad ..... Tille 


begin read(numpts); 
for i := 1 to numpts do 
begin read(ptarrl[i].x); 
read(ptarrlil.y) 
end; 
approxpad(numpts,ptarr) 
end. 


Het programma werkt niet alleen voor duizend punten. Het aantal 
punten wordt ingelezen (numpts). Dit aantal dient ten hoogste gelijk 
te zijn aan de constante die bij de definities van het programma is 
opgenomen (maxtps). Het programma is nog niet volledig, de proce- 
dure approxpad, waar alles om draait, moet nog worden geschreven. 
We zullen ons verder tot deze procedure beperken. 


rocedure approxpad(numpts: ptptr; var ptarr: ptss); 
{pre: true 
post: de punten zijn in een zodanige volgorde geplaatst dat het 
bijbehorend pad een heuristiek is voor de optimale oplossing} 
var ijj: ptptrs 
~ closedist: real; 
visited: array[ptptr] of boolean; 
thispt,closept: ptptr; 
begin for i := 1 to numpts do visited[i] := false; 
thispt := numpts; visited[thispt] := true; 
writeln; 
writeln('first point is '‚,thispt); 
i := l} 
{inv.: i = aantal punten in pad A 
(Ai: 1 < i < numpts: visited[i] = i in pad) A 
thispt is laatste in pad} 


Efficiëntie 


while i < numpts do 
begin closedist := maxreal; 
for j := 1 to numpts do 
if not visited[j] 
then if afst(ptarrlthispt], ptarr[j]) < closedist 
then begin closedist := 
afst(ptarrlthispt],ptarrlj]); 
closept := j 


end; 
writeln( ‘move from ',thispt,' to ',closept); 
thispt := closept; visited[thispt] := true; 


i := i+] 
end; 
writeln('return from ',thispt,' to ',numpts) 
end 


Als startpunt van het pad wordt het punt met het hoogste nummer 
gekozen. Nu wordt het punt gezocht dat de kleinste afstand heeft 
tot dit punt. Zo hebben we het tweede punt uit het pad gevonden. 
Dit wordt herhaald: steeds worden vanuit het laatst gevonden punt 
de afstanden bepaald tot de nog niet in het pad voorkomende punten 
en het punt met de minimale afstand wordt als volgende punt in het 
pad opgenomen. De hier gekozen strategie voor het algoritme wordt 
vaak toegepast bij algoritmen waar het erom gaat een optimum te 
zoeken. Bij iedere stap wordt het optimum bepaald en we hopen dan 
dat deze rij van beslissingen leidt tot een optimale oplossing voor 
het totale probleem. In dit geval garandeert de aanpak niet de opti- 
male oplossing voor het totale probleem, bij andere problemen kan 
dit wel het geval zijn. De strategie wordt de greedy methode 
genoemd. | 

Voor het algoritme geldt W(n) = O(n?). De orde van het algoritme 
kunnen we niet verbeteren, maar we proberen door kleine wijzigin- 
gen de constante, die bij de ordebeschouwing verdwijnt, te ver- 
kleinen. 

Een voor de hand liggende verbetering wordt bereikt door in de 
binnenste repetitie de twee aanroepen van de functie afst te ver- 
vangen door één aanroep: | 


if not visited[ jl] 

— then begin thisdist := afst(ptarrlthispt],ptarrl jl); 
if thisdist < closedist 
then begin closedist := thisdist; 

closept := j 
end 

end En 


De winst die hiermee bereikt wordt valt erg tegen. De constante was 
(vastgesteld door metingen) 47 en blijkt nu 45.6 te zijn (de werke- 
lijke tijd blijkt nu 45.6 * n? microseconden te zijn waarin n het aan- 
tal punten is). 

In de functie afst wordt de afstand berekend tussen twee pun- 
ten. Deze afstanden zijn nodig in de vergelijking voor het bepalen 


80 Voortgezet programmeren 


van het dichtsbijzijnde punt. Dit punt kan echter ook bepaald wor- 
den door de kwadraten van de afstanden te vergelijken. In de func- 
tie afst kunnen we dan het worteltrekken vermijden. 


function afstkwad(p,q: point): real; 
begin afstkwad := sqr(p.x- q.x) + sqr(p.y -q.y) end; 
if not visitedl[ jl 
then begin thisdist := afstkwad(ptarrl thispt] „ptarrl jl); 
if thisdist ........ 


De constante blijkt nu teruggebracht te zijn tot 24.2. Waarlijk een 
behoorlijke verbetering! En bereikt via een zeer kleine ingreep! De 
volgende ingreep is wat groter. In de repetitie worden alle punten 
bekeken om het punt te vinden met de kleinste afstand tot thispt. 
Van deze punten wordt dan met behulp van visited eerst nagegaan 
of ze al opgenomen zijn in de rij die tot dan gevormd is. Is dit niet 
het geval, dan wordt de afstand bepaald tot thispt. Kunnen we ons 
niet direct beperken tot de punten die nog niet in de rij opgenomen 
zijn? Deze punten moeten dan bijgehouden worden op een andere 
manier dan nu met het array visited. We voeren een nieuwe varia- 
bele in die de functie van visited overneemt, maar tegelijkertijd het 
mogelijk maakt om in de repetitie alleen de nog niet opgenomen pun- 
ten te beschouwen. 


var unvis: arraylptptrl of ptptr; 


Daarnaast introduceren we nog de variabele highpt en we zorgen 
ervoor dat als invariant van de repetitie geldt dat unvis[1..highpt] 
de nummers bevat van de punten die nog niet in de rij zijn opgeno- 
men. Zo krijgen we voor de procedure: 


procedure approxpad(numpts: ptptr; var ptarr: ptss); 
var j: ptptr; 
unvis: arraylptptr] of ptptr; 
thispt,closept,highpt: ptptr; 
closedist,thisdist: real; 
begin for j := 1 to numpts do unvisljl := j; 
thispt := unvislnumpts]; highpt := numpts -~ 1; 
writeln('first point is '‚,thispt); 
while highpt > 0 do 
begin closedist := maxreal; 
for j i*i to highpt do 
begin thisdist := afstkwad(ptarr[thispt],ptarr[unvisl[jll); 
if thisdist < closedist 
— then begin closedist := thisdist; 
closept := j 
end 
end; 
writeln('move from ',thispt,' to ' unvis[closept]l); 
thispt := unvis[closept]; 
unvis[closept] := unvis[highpt]; 
highpt := highpt - 1 
end; 
writeln('return from ',thispt,' to ',numpts) 
end 
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nae hk 
De moeite wordt slecht beloond: de constante is teruggebracht van 
24.2 tot 21.2. 

De volgende aanpassing wordt verkregen door bij het vergelijken 
van (de kwadraten van) de afstanden eerst eens naar de bijdrage 
van de x-coördinaat te kijken en pas als deze bijdrage kleiner is dan 
closedist de bijdrage van de y-coördinaat erbij op te tellen. Om dit 
te kunnen realiseren schrijven we de functie afstkwad uit op de 
plaats van de aanroep. We komen dan tot de tekst: 


thisdist := sqr(ptarrlunvisl[jl].x - thisx); 
if thisdist < closedist 
then begin thisdist := thisdist +sqr(ptarrlunvis[jll.y - thisy); 
if thisdist < closedist 
eden begin closedist := thisdist; 
closept := j 
end 


end 
De afstandberekening blijkt het stukje programmatekst te zijn waar 
veel winst is te behalen, want nu is de constante teruggebracht tot 
8:2, 

Er zijn nog andere aanpassingen mogelijk, ook al omdat we een 
benadering zoeken van de minimale afstand en niet het minimale pad 
zelf berekenen. Dit houdt in dat we gerust wat minder exact mogen 
rekenen, als we maar weten dat de gevonden oplossing een redelijke 
benadering is voor de optimale oplossing. We stoppen echter met het 
aanpassen. De procedure luidt nu: 


procedure approxpad numpts: ptptr; var ptarr: ptss); 
var j: ptptr; Stad 
unvis: array[ptptr] of ptptr; 
thispt,closept,highpt: ptptr; 
thisx,thisy: real; 
closedist,thisdist: real; 
begin for j := 1 to numpts do unvis[j] := j; 
thispt := unvis[numpts]; highpt := numpts - 1; 
writeln('first point is '‚thispt); 
while highpt > 0 do 


begin thisx := ptarrlthispt].x; thisy := ptarr[thispt].y; 
closedist := maxreal; 
for j := 1 to highpt do 
begin thisdist := sqr(ptarrlunvis[jl].x = thisx); 


if thisdist < closedist 
~ then begin thisdist := thisdist + 
En sqr(ptarrlunvisljl]l.y S thisy); 
if thisdist < closedist 
then begin closedist := thisdist; 
closept := j 
end 
end ep 
end; ER 
writeln('move from ',thispt,' to ',unvisl[closept]); 
thispt := unvis[closept]; 
unvis[closept] := unvis[highpt]; 
highpt := highpt - 1 
end; 
writeln('return from ',thispt,' to ' numpts) 
end 
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(We zijn er steeds van uitgegaan dat de functie maxreal ter beschik- 
king stond, die de maximale waarde van het type real aflevert.) 

Wat we gewonnen hebben met al onze aanpassingen is een factor 
6; deze snelheidsverbetering kan in sommige situaties van groot 
belang zijn. Zo kan in ons voorbeeld de waarde van n zodanig zijn 
dat het optimale algoritme (bijvoorbeeld backtracking) geen enkele 
zin heeft omdat het exponentieel is. De eerste heuristiek zou echter 
ook nog onbruikbaar kunnen zijn omdat het algoritme teveel tijd 
vraagt. De factor 6 zou nu zoveel winst kunnen opleveren dat het 
algoritme inderdaad praktisch bruikbaar wordt, omdat de dan beno- 
digde tijd bij een bepaalde waarde van n niet groter is dan een of 
andere grenswaarde (door de 'buitenwereld' gegeven). 

We moeten wel oppassen met het aanpassen van algoritmen. Op de 
eerste plaats moeten we ervoor zorgen dat de aanpassingen niet de 
correctheid van het algoritme verstoren (ervan uitgaande dat het 
oorspronkelijke algoritme correct is; het efficiënter maken van een 
niet correct algoritme heeft weinig zin). De aanpassingen zijn bedoeld 
om het algoritme sneller te maken. Uit het voorbeeld blijkt al dat het 
vaak niet zo voor de hand ligt welke aanpassingen werkelijk tot 
grote besparingen leiden (afgezien van enkele triviale zaken). Wel 
zagen we dat besparingen van vermenigvuldigingsoperaties (bijvoor 
beeld machtsverheffen, worteltrekken) lonen. 

Nadelen van de aanpassingen zijn dat de lengte van de tekst van 
het algoritme groter wordt en - wat een groot nadeel is - dat over 
het algemeen de leesbaarheid van de programmatekst ook slechter 
wordt. Het kan zijn dat de aangepaste tekst onbegrijpelijk is gewor- 
den doordat de gemaakte stappen niet in de aanpassingen zijn ver- 
meld als een soort documentatie. 


3.4 OPGAVEN 


1. Voor het algoritme van opgave 8 van hoofdstuk 1 kan al dan niet 
gebruik worden gemaakt van een hulpvariabele. Vergelijk de 
ordes van de twee algoritmen. 


2. In hoofdstuk 1 (inclusief de opgaven) staat een aantal algoritmen 
voor de berekening van het n€ getal uit de rij van Fibonacci. 
Vergelijk deze algoritmen wat betreft de efficiëntie. 


3. Gegeven 


var a: array[0..N] of integer; {N 2 0} 
var x: integer; 


Schrijf een programma dat als postconditie heeft: 
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BE CE ENE EAN E N a 


PES OSD Sense ali} el 


voor onderstaande gevallen: 


a. Kies als invariant: p= Sirs Ens ali] nes A OSnsN 
b. Kies als invariant: p= (Si:O0SisN:alij ER T) A OSnsN 
c. Kies als invariant: p= (Gitans isN ali] ex) A OSnsN 


d. Kies als invariant: p= (Si:O0sisn:alilex T) AOSnsnN 


Vergelijk de efficiëntie van de algoritmen, mede lettend op de 
(soort) operaties. 


4. Gegeven 


var A: arrayl0..1,0..Jl of integer; {I 2 0,J 2 0} 


Schrijf een programma dat als postconditie heeft 
KI RS EIAOGS ISI REL TEE O3 


voor elk van de onderstaande gevallen: 


a. Van A is verder niets bekend. 


b. (Ai,j : O 


IIA 


ERIAS: 


IA 


Jos Ali, ij a ALLII A 
Alsje O SESINO iega SI EMES 


(hint: neem als invariant 


IA 


I s Alij] EOF as 


ZAG SI ET r Alart OLH 


(Ni,j : Q i 


IIA 
IA > 
< 
IA 
t 
IIA 
ar 


IA 


k + (Ni;jj:p<i 


IA 
A 
IV 


Be AJ EOL CTNOS JS es AG] B ALERL IJD A 


IA 
IIA 
IIA 


wM : OS ISTAOS FSI: AMi LSM 


(hint: neem dezelfde invariant als bij b.). 


Schrijf tevens voor elk van bovenstaande 3 gevallen een pro- 
gramma met als postconditie 


Rn BJS ORS EADS ISI rs Ali] =D} 


Geef ordebeschouwingen voor elk van de geschreven programma's 
en vergelijk ze. 
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5. Ontwerp een procedure die een array van N elementen over k 
(0 < k < N) posities naar rechts roteert. (Bijvoorbeeld: de vec- 
tor ABCDEFGH over 3 posities naar rechts roteren geeft 
FGHABCDE.) 

Zoek een oplossing van O(N) die geen hulparray gebruikt. 


4 INTERN SORTEREN 


4.1 INLEIDING 


Het onderwerp sorteren komt aan de orde omdat 


- sorteren een veel voorkomende activiteit is waar een groot aantal 
algoritmen voor bestaat; 
- het interessant is de verschillende algoritmen te vergelijken. 


Onder sorteren verstaan we het, op grond van een bepaald sorteer- 
criterium, in volgorde zetten van gegevens. Zo kunnen getallen 
gesorteerd worden in niet-dalende volgorde en teksten in alfabetische 
volgorde. Anders gezegd: Indien op een eindige verzameling V een 
lineaire ordeningsrelatie is gedefinieerd (voor elk tweetal elementen 
x € Ven y € V geldt x =y of x< y of x>y), dan verstaan we onder 
sorteren het expliciet aangeven van de volgorde van de elementen 
van V. 

De te sorteren objecten zijn gegeven in een array 


type rij = arrayll..nl of basistype; 
var a: rij; 


We gaan ervan uit dat voor het basistype de lineaire ordeningsrelatie 
geldt. 

In een sorteerproces kan men twee activiteiten onderscheiden die 
beide vaak worden uitgevoerd: 


- ordeningsinformatie verzamelen door de te sorteren objecten met 
elkaar te vergelijken op grond van het sorteercriterium; 

- de objecten onderling in volgorde in het array plaatsen op basis 
van de zojuist genoemde informatie (bijvoorbeeld door de objecten 
van plaats te doen wisselen). 


Bij het vergelijken van de verschillende algoritmen zal het aantal 
malen dat een bepaalde activiteit uitgevoerd wordt een rol spelen; 
het onderscheid tussen de twee genoemde activiteiten zal ook ver- 
schillende vergelijkingen opleveren. 

We gaan er (voorlopig) van uit dat er van het basistype en van 
de waarde van a niets naders bekend is. 
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Stel dat xj (1<i <n) waarden zijn van het basistype. De precon- 
ditie voor het sorteerprobleem kunnen we formuleren als: 


(Ai : isisn:alij = x.) 


(het array heeft een waarde). De postconditie is dan 


het array a bevat een permutatie van de rij X4 X9 »»» Xn en 
wel zodanig dat geldt: (Aj:1<j<n: alj] < alj+1}) 


Deze laatste voorwaarde kunnen we ook formuleren als: 


aigis i Eja tes nea San 


4.2 INSERTION SORT 


Als invariant P nemen we: (Aj : 1< j< i:aljlsalj+i}) A (lsisn). 
Samen met i = n levert P de eindrelatie op. De opzet van het algo- 
ritme wordt dan: 


i := 1; {P} 
while i <> n do 
begin i := i+1; {ali} s a[2] £ ... < a[i-1]} 
'herstel de invariant ' 
{P} 
end 
(Ai =ñ} 


Voor het herstellen van de invariant kunnen we a[i] op de juiste 
plaats tussenvoegen in de gesorteerde rij a[1..i-1]. Het komt dan 
neer op de wijze waarop veel kaartspelers hun kaarten sorteren. In 
het array wordt plaats gemaakt door de waarden van ali-1},ali-2],... 
een ‘plaats naar rechts te schuiven'. De daarvoor in aanmerking 
komende waarden zijn die waarden die groter zijn dan x (waarbij x 
staat voor het tussen te voegen element alil). 

Het tussenvoegen kan op een aantal manieren gerealiseerd worden: 


- Vergelijk achtereenvolgens de waarden van ali-1], a[i-2], enzo- 
voort met x en schuif deze waarden op naar respectievelijk ali], 
ali-1], enzovoort, totdat de plaats voor x is gevonden, en zet x 
op deze plaats. | 

- Bepaal de plaats van x via een binary search, schuif de waarden 
trechts' hiervan een plaats naar 'rechts' en zet x op de vrijgeko- 
men plaats. 
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- Als ali-1] >alil, verwissel dan ali-1} en a[i], als dan ali-2] 
> ali-1] verwissel dan a[i-2] en ali-1], enzovoort totdat de rij 
gesorteerd is, 


We zullen de eerste aanpak netter uitwerken. 
Voor het schuiven nemen we als invariant 


es Sk AK ea} adh AL SDE ide 


De eindrelatie, de plaats voor x is gevonden, wordt opgeleverd als 
j = lof, voor het geval j >1, als x 2 al[j-1]. Dit leidt tot een geval- 
lenonderscheid, dus tot de repetitie 


while (j > 2) and (alj-1] > x) do .…… 


gevolgd door een aparte behandeling van a[1]. Het gevallenonder- 
scheid kan op een aantal manieren voorkomen worden: 


- We houden invariant (Ak : j < k S i: x < alk]) en introduceren 
de boolean inspos met 


inspos > alj-1l < x 


(inv. A inspos betekent: plaats van het 'gat' gevonden). Zo krij- 
gen we dan voor het tussen voegen: 


j «= i) inspos := false; x := al il; 
while (j > 1) and not inspos do 
Ent aldelf zen 
then begin alj] := alj-1l; j := j-1 end 
else inspos := true; On 
aljl := x 


- We pakken het schuiven anders aan: 
vanaf index 1 wordt er naar het 'gat' gezocht; 
vanaf index i-1 worden de waarden één plaats naar 'rechts' 
geschoven. 


fes ilj ž := alif; 
while x > alj} do j := j+1; 
for k := i downto j+1 do alk] := alk-1}; 


alj] := x 


(Om de eindigheid te garanderen hebben we x >œ a[j] genomen in 
plaats van x 2 alj}.) 


- We gebruiken een sentinel, waardoor de voorwaarde voor de repe- 
titie beperkt kan worden tot x < a[j-1]. Als sentinel gebruiken we 
ali} = (MINj : tS j $ n: alj}). Zo krijgen we: 


88 Voortgezet programmeren 


procedure insertionsort(var a: rij); 
pre: (Ät: -Si Snralil = Xi) 
post: ali] s al[2] s ... s aln] Aalí..n}l is permutatie van 
X1 X3 .. . Xn} 
vat i Tep: Fion? 
a Min, basistype; 
begin {sentinel bepalen: } 
iss limite Aij) peen d} 
{inver alp] = Mins IMENJ tf sja ie alj} 
while i <> n do 
begin i := i+]; 
if ali] < min then begin min :=a [i]; p:=i end 


end; 
alp] := a[1]; a[1] := min; {a[1] heeft sentinelwaarde} 
i := 1; {[inv.1:; a[1..i] is gesorteerd} 
while i <> n do 
begin i := itl; X := alil]; 
B d 
{inv.2: (Ak: j <kSi:x< Akh ts don i 
while x < al j=1| do 
begin alj] := alj-1]; j := j-1 end; 
{inv.2: Ax 2 alj-1}} een 
aljls=.x 
{inv.1} 


end 
{inv.1 A ic= nl} 
end 


4.3 SELECTION SORT 


Het tussenvoegen, dat nodig is bij de insertion sort, is vervelend. 
Het kan vermeden worden als a[1..i] steeds de i kleinste waarden 
bevat van all..n]. We kunnen deze eis toevoegen aan de invariant P 
van de insertion sort. We nemen nu i-1 in plaats van de i uit P en 
krijgen zo als invariant Q: 


alj+1]) A 
RK Smid S al ALTER dn) 


j < i-1:alj] 
J s LAAR IE 


(Aj: 1 
(Ale 1 


WA HA 
WA HA 


Als Q geldt wordt de eindrelatie opgeleverd als bovendien geldt i=n. 
Als opzet van het algoritme krijgen we nu: 
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i : 1; {0} 
while i <> n do 
begin {Q} 
‘geef a[i] de kleinste waarde uit ali..nl'; 
i s=itl 
{Q} 
end 
IOA te md 


Het minimum bepalen van ali..n} en dit toekennen aan ali] hoeven we 
hier niet verder uit te werken. We hebben zo gevonden: 


procedure selectionsort(var a: rij); 
{pre: (Ai: 1 Ss isn:alil = xi) 
post: (al 1] al2] < ... S ain] A ali..nl is permutatie van 
X1 X2 GE, 

var i,j,p: 1..n; 

min: basistype; 
begin. i +a 1;. {Q} 

while i <> n do 


WA HIA 


begin min := alili Daes Heike eme 
{inv.: alp] = min = (MINk: i Sk < j: alk])} 
while j < n do 
begin {inv. A i Sj <n} 
Ek ¿= j+1; 
if alj] < min then begin min := alj]; 
p: 
end 
end; {inv. A j = n} Re 
alp] := alil; ali] := min; 
i := itt {Q} 


{Q Ai =n, d.w.z. ali..n} is gesorteerd} 


4.4 SORTING BY EXCHANGE 


We gaan uit van dezelfde invariant als bij de selection sort. Deze 
invariant Q luidt informeel: 


al1..i-1] is gesorteerd en al1..i-1] bevat de kleinste 
i-1 waarden uit al1..nl 


Als opzet van het algoritme kiezen we: 
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i:= 1; {Q} 
while i <> n do 
begin {Q A i < n} 
geef ali] de kleinste waarde uit ali..nl'; 
i := itl} 


{Q} 


end 


{o^a i=n} 


Het toekennen van de kleinste waarde uit ali..nl aan ali] kan op de 
volgende manier: 


als a[n] < a[n-1], dan wissel de waarden van a[n] en a[n-1] om; 
als a[n-1] < a[n-2], dan wissel de waarden van a{n-1] en a[n-2] om; 
als a[n-2] < a[n-3], dan wissel de waarden van a[n-2] en a[n-3] om; 


als a[i+1] < a[i], dan wissel de waarden van a[i+1] en a[i] om; 


Na dit proces bevat a[i] de kleinste waarde uit a[i..n]. Na ophoging 
van i met 1 geldt dan weer de invariant. 
Als invariant voor dit proces nemen we: 


(Ak::3 sk nnal) e alki) 
De gewenste eindrelatie wordt opgeleverd als j = i. Stel echter dat 
bij het bovenstaande proces a[m] en a[m+1] als laatste elementen van 
waarde gewisseld zijn (a[i],a[i+1],...,a[m-1] zijn niet gewisseld). 
Dan weten we dat alm] za[m-1] 2 ... 2 a[i] en alm] is de kleinste 
van a[m..n]. We krijgen dan de invariant Q ook als we i :=m+1 
nemen in plaats van i :=i+1. Zo krijgen we de volgende procedure: 


procedure bubblesort(var a: rij); 
{pre: (Ai: 1 ts Hratil = Xi) 
post: (al1]l <af[2]- s ... < aln}l) A al1..n} bevat permutatie 
van X1 Xj ... Xaj 
var i jmc de] 
goei basistype; 
begin i := 1; 
{Q} 
while i < n do 
begin j := n; m := n; 
{inv.: (a[j] = (MINk:j< k < n:alk]) A 
(j <m < n > (alm],a[m+1]) is het 
laatste verwisselde paar uit alj..n})} 
while j > i do 
begin if alj-1l > alj] 


IA HA 
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then begin h := aļlļj-1]; 


alj-1] := alj]; 
alj] := h; 
m := j=l 
end; 
J er J> 


end; 
{al1] s al2] < ... < alm] en ali. .m} bevat 
kleinste m waarden van al[1..n]} 
i := m+1 
{Q} 
end 
{Q A i z n, d.w.z. dat ali..nl is gesorteerd} 
end 


In het algoritme wordt door verwisseling het kleinste element van 
ali..n] op ali] geplaatst. We zouden als invariant ook hebben kunnen 
nemen: 


a[j+1..n] bevat de grootste n-j waarden en is gesorteerd 


Door verwisseling wordt dan de grootste waarde van a[1..j] op alj] 
geplaatst. Het algoritme wordt wel de bricksort genoemd. 

Een derde variant ontstaat door de bubblesort en de bricksort 
te combineren. De invariant luidt: 


a[1..i-1] bevat de kleinste i-1 waarden en is gesorteerd A 
a[j+1..n] bevat de grootste n-j waarden en is gesorteerd 


Door afwisselend de grootste waarde op a[j] en de kleinste waarde 
op ali} te plaatsen door verwisseling, wordt het totale array gesor- 
teerd. Het algoritme wordt wel de cocktailsort genoemd. 


4.5 VERGELIJKING VAN DE PROCEDURES 


We vergelijken nu de efficiëntie van de drie sorteermethoden, waar- 
bij we eerst het vergelijken van twee waarden van het basistype als 
karakteristieke operatie nemen. 

Bij het sorteren door invoegen (insertion sort) kost het eigenlijke 
invoegen O(i) stappen (j krijgt initieel de waarde van i). Dit gebeurt 
voor i vanaf 1 met stappen van 1 tot en met n. Voor het totale algo- 
ritme geldt dan 


n 
Wn) =O() i) =O(n?). 
i=1 
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Als het array al gesorteerd is, zal in iedere slag van de repetitie 
slechts één vergelijking plaatsvinden en dus geldt in dat geval als 
orde O(n). 

Bij het sorteren door selectie (selection sort) kost de ‘binnenste! 
repetitie O(n-i) slagen. Voor de orde van het totale algoritme geldt 
dan 


n 
W(n) =O( f (n-i)) = O(n(n-1)/2) = O(n?) . 
is] 


Het is eenvoudig na te gaan dat ook A(n) = O(n?). Zelfs in het geval 
dat het array al gesorteerd is kost het algoritme O(n?) stappen. 

Bij het sorteren door verwisselen (bubble sort) kost de binnenste 
repetitie in alle gevallen n-i slagen. Dus geldt voor de bubble sort, 
zoals voor de selection sort, W(n) = O(n?). In het gunstigste geval, 
dat optreedt als de rij al gesorteerd is, wordt de buitenste repetitie 
slechts één maal uitgevoerd; de orde is dan n. 

Als het basistype niet het type integer is maar bijvoorbeeld een 
recordtype met veel componenten en de vergelijking vindt plaats op 
één van de componenten, die bijvoorbeeld van het type integer is, 
dan zal het verwisselen van twee waarden bij de beoordeling van de 
algoritmen veel zwaarder moeten wegen dan bij de bovenstaande ver- 
gelijking (waar het helemaal niet in beschouwing is genomen). Als we 
letten op het aantal verwisselingen, is de selection sort gemiddeld veel 
beter dan de andere twee algoritmen. In de selection sort is het aan- 
tal verwisselingen n-1 (met extra maatregelen kan het soms kleiner 
zijn). Bij de andere twee algoritmen is het aantal verwisselingen in 
het slechtste geval n(n-1)/2, in het gunstigste geval, als de rij al 
gesorteerd is, is het aantal verwisselingen echter 0. Dat de selection 
sort gemiddeld goed 'scoort' komt doordat verwisselingen bij dit 
algoritme over een grote afstand plaatsvinden en niet, zoals bij de 
andere twee algoritmen, tussen 'buren'. We komen op dit punt later 
nog terug. 


Bekend is dat voor het sorteren met als karakteristieke operatie het 
vergelijken geldt F(n) = O(n log n). De drie bekeken algoritmen 
hebben alle drie een orde n?. Om het verschil tussen n? en n *log n 
nog eens te benadrukken geven we de onderstaande tabel: 


n n? n *log n n?/n*log n 
10 100 33,2 3,01 
100 10000 664,4 15,05 
1000 1000000 9966 100,34 
10000 100000000 132877 152,58 


Het verschil tussen n? en n *log n wordt bij grote n wel erg groot. 
Zijn er dan geen algoritmen die een orde hebben die beter is dan de 
n? die we tot nu toe gezien hebben? 
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4,6 SHELL SORT 


Het sorteren zou versneld kunnen worden als de verwisselingen van 
waarden over grotere afstanden zouden kunnen plaatsvinden. We zul- 
len dit op de volgende manier trachten te realiseren. We gaan er daar- 
bij, voor het gemak, van uit dat n een 2-macht is. We definiëren binnen 
het array zogenaamde ketens. Een keten is een rij elementen van het 
array all..n} met een constant verschil tussen de indices van opeen- 
volgende elementen. Uitgaande van de constante ine (1 < ine < n) 
kunnen we binnen het array de volgende ketens onderscheiden: 


all], afl tinoj all + 2 *inc}, all +3 * inc], < 
a[2}, ai2 + inc], a[2 + 2 *inc], al2 + 3 * inc], .… 


Het aantal verschillende ketens bij constante waarde van inc is gelijk 
aan inc. 

Voor het sorteren van het array a passen we nu het volgende 
algoritme toe: 


inc := n; 
{inc heeft als waarde de laatst gebruikte ketenafstand} 
while inc > 1 do 
begin inc := inc div 2; 
{sorteer elk van de inc ketens: } 
j := 0; {j ketens gesorteerd} 
while j < inc do 
begin j := j+1; 
‘sorteer keten j' {bijvoorbeeld d.m.v. 
insertion sort} 
end 


Ennens 


end 


Keten j bestaat uit twee gesorteerde ketens met een ketenafstand die 
de helft is van de heersende ketenafstand. Het sorteren van keten j 
komt dan neer op het samenvoegen van de in de vorige slag van het 
algoritme gesorteerde deelketens. Als we voor het sorteren van de 
ketens de insertion sort gebruiken zullen 'buren' uit de keten ver- 
wisseld worden. Maar buren in de keten hebben in het array a een 
afstand inc. Er gebeurt dus inderdaad wat we wilden: verwisselingen 
binnen het array a over een grotere afstand dan 1, zoals dat bij de 
vorige algoritmen het geval was. Dit resultaat blijkt inderdaad lonend 
te zijn, want er kan voor het algoritme afgeleid worden dat 
W(n) = O(nl.5). We zullen hier de analyse die tot dit resultaat leidt 
niet geven. 

De gehanteerde sorteermethode wordt wel genoemd: sorting by 
diminishing inerement. Hieronder volgt de procedure die genoemd is 
naar de ontwerper van dit algoritme (Shell). 
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rocedure shellsort(var a: rij); 
{pre: (Ai: 1 £< isSn:alil = Xi) 
post: (ali} <al2} $... $ a[n]) a (a[1..n] bevat een permutatie van 
X1 X2 . e. Xn)} 
var inc, current, previous, k, j: integer; 
er. Ai basistype; 
inspos: boolean; 
begin inc := n; 
while inc > 1 do 
begin inc := inc div 2; 
j := 0; {inv.: j ketens gesorteerd} 
while j < inc dọ 
begin j := j+1; 
k := j + inc}; 
{inv. voor insertion sort van keten j: 
alj} á alj + inc} s ... < alk - inc] 
(zie verder bij insertion sort) } 
while k < n do 
begin x := alk]; inspos := false; 
current := k; 
previous := current - inc; 
{inv.: (Ai: current < i S k a 'i is een 
ketenindex' : x <alij) A 
inspos =» alprevious] < x} 
while (previous ž j) and not inspos do 
if x <alprevious] ` 


then begin a[current] := a[previous]; 
current := previous; 
previous := previous - inc 
end 
else inspos := true; 
alcurrent] := x; 
k := k + inc 


end 
end 
end 
end 


Voor het sorteren van een keten is de insertion sort gebruikt. De 
relatie met insertion sort is: 


- ìÌisnuk: 
- jis nu current; 
- j-lis nu previous (current - previous = inc). 


Bij een goede keuze van de achtereenvolgende increments (een 
andere keuze dan hierboven gebruikt) kan voor de orde zelfs 
bereikt worden: O(n1-2) (O(n * log n *log(logn))). Deze O(n1-2) 
van Shell sort is beter dan de O(n?) van de andere algoritmen. 
Maar kunnen we de ondergrens van O(n * log n) niet bereiken? 

We zullen in het vervolg enkele nog betere algoritmen bekijken. 
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47 HEAP SORT 


We definiëren eerst het begrip 'heap'. Daartoe gaan we uit van het 
array 


var x: arrayl1..nl of basistype 


We noemen het deel x[p..q] (1 <p <q <n) van het array x een 
heap als geldt 


(Ai:-pSisaq:{(2+isgqsex[il 2 x[2+il) A 
(2xi+1 < q > xli] 2 x[2*i+1l)) 


We zullen deze eigenschap verder aangeven met heap(x[p..q]). Er 
gelden als eigenschappen: 


- als x[1..n] een heap is dan is x[1] het maximum van x[1..n]; 
- de deelrij x[n div 2 + 1..n] is een heap; 
- als a[p..q] een heap is dan ook a[p+1..q] en a[p..q-1]. 


Stel nu dat we beschikken over de procedure 


procedure sift(var a: rij; p,q: integer); 
pre: alp+1..q] is een heap (1 <p Sq Sn) 
post: alp..gl is een heap} 


Uitgaande van de 'tweede helft' van het array x kunnen we, door 
herhaalde aanroepen van de procedure sift, van het array x een 
heap maken. Dan is x[1] de maximale waarde. Deze verwisselen we 
met x[n]. Van x[1..n-1] wordt weer een heap gemaakt door middel 
van een aanroep van de procedure sift. Dan is x[1] het maximum 
van x[1..n-1]. Deze verwisselen we met x[n-1]. Van x[1..n-2] wordt 
weer een heap gemaakt. Enzovoort. Zo krijgen we als sorteerproces 
de heap sort. 


procedure heapsort(var a: rij); 
pre: (Ai: 1 < i á n:ali] = Xi) 
post: (al1] RI SSRI A 
(al1..n] bevat permutatie van Xg X5 ee XJ 
var i: integer; | 
~ h: basistype; 


IIA IA 


begin i := n div 2 + 1; {inv.: heap(ali..nl)} 
while i <> 1 do 
begin i := i-l; sift(a,i,n) end; 
{al1..n] is een heap} 
iens 


{inv.: heap(al1..il) A 
ali+ij Ss alteal:s ..….salnl A 
ali} < ali+1i}} 
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while i <> 4:40 
begin wissel(alil,al il); 
Zeem Zels: Bift(la,l,i) 
end 
ee 


Het aantal slagen van de tweede repetitie is n. Per slag wordt de 
procedure sift aangeroepen. Wil voor de totale sortering gelden 
O(n *log n), dan zal voor de procedure sift moeten gelden 
O(log n). 

Laten we de procedure sift bekijken. Gegeven is dat a[p+1..q] 
een heap is. We voegen a[p] toe en het geheel moet weer een heap 
zijn. Als geldt dat a[p] z al2*p] en a[p] 2 al2*p+1] dan geldt de 
heap-eigenschap al. Geldt ten minste één van de ongelijkheden niet, 
dan verwisselen we a[p] met de grootste van a[2 * p] en a[2 * p+1]. 
Noem de index van het element waarmee a[p] verwisseld is even j. 
Wil de heap-eigenschap voor a[p..q] gelden dan moet a[j] 2 a[2 *j] 
en alj] z a[2 xj+1]. (Voor de andere index die in het spel was bij 
alp] behoeft niets te gebeuren.) Als ten minste één van de ongelijk- 
heden niet geldt, wordt a[j] verwisseld met de grootste van a[2 *j] 
en a[2 x j+1]. Enzovoort. 


procedure sift(var a: rij; p,q: integer); 
{pre: heap (alp+1..ql) A (1SpSqSn) a alp..q} heeft een waarde 
post: heap(alp..al) } 
var i,j: integer; 
‘heap: boolean; 


begin i := p; j := 2 * i; {j is een hulpvariabele} 
Eeen 
then heap := true 


else begin if j < q 
then if alj] < alj+t1l then j := j+1; 
heap := (alil >= al jl) 


end; 
{inv.: heap = (Ak:p Sk < i: (2+i < q » ali] z a[2*i]) 
A (2#i4+1 3 qali] 2 al2#i+1}))} 
while not heap do 
begin wissel(alil,aljl); 
i is jeanet i; 
AEC Ng 
< then heap := true 
else begin if j < q then if alj] < alj+1] 
-a then j := j+1; 
heap := (ali] >=aljl) 


end 


end 
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Het is niet moeilijk na te gaan dat het algoritme sift inderdaad 
log n slagen maakt, waarmee het totale heap sort proces van de orde 
n * log n is. 


4.8 QUICK SORT 


Stel dat we beschikken over een procedure partition: 


procedure partition(var a: rij; var i,j: integer; s,t: integer); 
oe: i se SE SN 


poet: (EN: S a RE Lr (Avis sys Jr aiea A 
(Ay: j SyS i:alyl =alxl) A 
(Ays isy St: aly] 7 alk) aA 


A 
IA 
Ga 
A 
ra 
A 
ct 
u 


Met deze procedure kan een array x gesorteerd worden door het via 
de procedure partition te verdelen in drie stukken: x[1..j-1], 
x[j..il en x[i+1..n], het eerste en het derde stuk weer te onderwer- 
pen aan de procedure partition en dit te blijven doen totdat alle 
linker! en ‘rechter! stukken 1 lang zijn. Dit levert een correct resul- 
taat omdat bij de verdeling in drie stukken het middelste stuk 
(onderling gelijke) waarden bevat die - wat de uiteindelijke sortering 
betreft - reeds op hun plaats staan. 

De sortering van het array x van het type rij wordt bewerk- 
stelligd door de aanroep quicksort(x,1,n) van de procedure 


procedure quicksort(var a: rij; p,q: integer); 
pres F spagan) AAi psi garali] = Xi) 
post: (ALDI S alptil Ss. S aldi) A 
(a[lp..q] bevat permutatie van Xp Xp+1 »-» Xą)} 
var i,j: integer; 
begin if p < q then begin partition(a,i,j,p,q); 
E E ANE soio S gudeksort (a.p, jriji 
quicksort(a,i+1,q) 


IA IA 


end 


end 
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De recursie eindigt omdat de intervallen al{p..j-1] en ali+1..q] in elke 
aanroep kleiner worden. Voor het verdelen van een interval (de 
procedure partition) wordt gebruik gemaakt van het Dutch National 
Flag algoritme. De invariant kunnen we in beeld brengen als 


Uitwerking van de procedure partition: 


procedure partition(var a: rij; var i,j: integer; s,t: integer); 
{voor pre- en postconditie: zie boven} 
var r‚w: basistype; 
h: integer; 
begin r := al(stt) div 2]; {r € als..t]} 
j tes; d := t; hee t} 
{inv. (informeel, zie ook bovenstaand plaatje): 
de elementen van a[s..j-1] zijn kleiner dan r 
de elementen van a[h+1..i] zijn gelijk aan r 
de elementen van a[i+1..t] zijn groter dan r} 
while j <= h do 
begin w := alh]; 
if w= r then h := h-1 
else if w > r then begin wissel(a[i],a[h]); 
h := h=l; i ṣ= i-1 


end 
else begin wissel(aljl,alh]); 
js Jt] 
end 


end 


Als we ervan uit gaan dat het array steeds in twee gelijke stukken 
wordt opgedeeld (het stuk met de gelijke waarden laten we even 
buiten beschouwing), bestaat het array na de dé opdeling uit 2q 
delen. Het aantal slagen van de procedure partition voor alle stuk- 
ken samen is O(n). Er waren log n opdelingen, dus het algoritme 
kost in totaal O(n * log n). Dit geldt voor de optimale situatie 
waarbij voor iedere opdeling de mediaan van het betreffende stuk 
als referentie-element wordt gekozen. 
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4,9 VERGELIJKING VAN HEAP SORT EN QUICK SORT 


Zowel voor heap sort als voor quick sort geldt A(n) = O(n *log n). 
Wat het slechtste gedrag betreft geldt voor heap sort dat ook 

W(n) = O(n *log n). Dit is eenvoudig aan de procedures heapsort 
en sift te zien. Voor quick sort geldt echter W(n) = O(n?). Het 
slechtere resultaat van quick sort wordt veroorzaakt door de keuze 
voor r in de procedure partition. Als steeds geldt r = min(af[s], 
als+1],...,alt]), dan plaatst de procedure partition deze kleinste 
waarde in als] en de procedure partition werkt dan op dezelfde 
manier als de binnenste repetitie van de selection sort en het totale 
sorteerproces verloopt ook op dezelfde manier. Dit slechtste geval 
treedt bijvoorbeeld op als alle waarden gelijk zijn (het array is dan 
gesorteerd! ). Als het array gesorteerd is en voor de waarde van r 
wordt het eerste element van het interval genomen, treedt ook dit 
slechtste geval op. 

Het slechtste geval kan vermeden worden door voor r de mediaan 
te kiezen van als..t] of een goede benadering hiervoor. (De mediaan 
is die waarde waarvoor geldt dat er evenveel waarden kleiner als 
groter zijn.) Een benadering krijgen we bijvoorbeeld door de medi- 
aan van drie elementen van a[{s..t] te nemen. 

Ondanks het slechtere gedrag van quick sort in het slechtste 
geval, wordt quick sort veelal geprefereerd boven heap sort. In het 
gemiddelde geval is quick sort namelijk sneller dan heap sort door- 
dat de constante in C *n * log n voor quick sort (een factor 2) 
kleiner is dan voor heap sort. Bovendien kan men, zoals hierboven 
al aangegeven, maatregelen treffen om de kans op het slechtste 
geval kleiner te maken. Er is nog een voordeel van quick sort. Voor 
kleine aantallen te sorteren getallen kan een algoritme als de bubble 
sort wel sneller zijn dan de quick sort of heap sort; dit komt ook 
weer door die constanten die er, voor kleine n, voor zorgen dat 
C1 * n? bijvoorbeeld kleiner is dan C2 * n * log n. Hiervan kunnen 
we gebruik maken in de procedure quicksort. We kunnen daar de 
test p < q vervangen door bijvoorbeeld p < q-15 en dan voor de 
kleine trajecten (15 of minder elementen) de bubble sort (of een van 
de andere sorteeralgoritmen) gebruiken. Voor kleine trajecten blij- 
ken de ‘eenvoudige! algoritmen aantrekkelijk te zijn. Het totale array 
wordt dan bijvoorbeeld gesorteerd door: 


quieksort(l,n); insertionsort(1,n); 


Omdat in een klein interval (15 of minder elementen) na de aanroep 
van quicksort alleen waarden voorkomen die ten hoogste gelijk zijn 
aan de waarden in de intervallen rechts van dit interval, zal de 
insertion sort voor het hele array werken op elk van de intervallen 
afzonderlijk. 

Een aanpassing, zoals hierboven beschreven voor quick sort, is 
voor heap sort niet mogelijk. 
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We bekijken nu een derde algoritme uit de klasse van O(n * log n)- 
algoritmen. 

Het sorteren gebeurt bij dit algoritme door te mengen. Dit meng- 
proces verloopt op de volgende wijze. Plaats de elementen van de 
paren (alll,al2]), (al3],al4]), (al5],al6)), … onderling in de juiste 
volgorde. Voeg elk tweetal opeenvolgende paren samen tot een geor- 
dend viertal. Voeg elk tweetal opeenvolgende viertallen samen tot 
een geordend achttal. Enzovoort. 

Stel dat we beschikken over de procedure 


procedure mergepass(var a,h: rij; m: integer); 

{pre: a bestaat uit geordende m-tallen: 
(al1l,al2],...,alm}), (almt1],alm+2],...,al24m}), 
(al2*mt1},al24m+2],...,al3*m]), ... zijn geordend 

post: h bestaat uit geordende 2*m-tallen: 
(h[1]‚h[2],...,n[2em]), (n[24m+1],n[24mt2],..., 
h[4*m]), ... zijn geordend (h is permutatie van a) } 


Dan luidt de procedure mergesort: 


procedure mergesort(var a: rij); 
(pre: (At: 4 ik Ss mi ali] = Xi) 
post: täl thees WEL S 2006 mln): A 
(a[1..n] bevat een permutatie van Ky NS AN) 
var hi rijks 
m,i: integer; 
begin m := 1; 
{inv.: a bestaat uit geordende m-tallen} 
while m < n do 
begin mergepass(a,h,m); 
for i se 1 00 mdo ali] : +f]; 
men Demi ie 
end 


end 


Deze procedure maakt log n slagen. 
Voor het realiseren van de procedure mergepass gaan we ervan 
uit dat we beschikken over de procedure 


procedure merge(var a,h: rij; o,m,p: integer); 
(Pee: (alo) salo+i} s ... s alm]) A-(alm+il s .….s alp]) 
post: (h bevat een permutatie van a) A 
(ALOT S RIO Se E hID) 


De procedure mergepass bestaat nu uit het herhaaldelijk toepassen 
van de procedure merge. 
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De procedure merge mengt stukken van willekeurige lengte omdat in 
de procedure mergepass niet zal gelden (tenzij n een 2-macht is) dat 
er steeds volledige m-tallen te mengen zijn. 


procedure mergepass(var a,h: rij; m: integer); 
{voor pre- en postconditie: zie boven; het is niet 
nodig dat er een geheel aantal m-tallen is in a} 
var i,t: integer; 
begin i := 1; 
{inv.: i = 'kleinste index van het eerste m-tal 
van de twee samen te voegen m-tallen'} 
while i+2*m-{<= n do 
begin {er zijn nog twee volledige m-tallen} 
merge(a,h,i,i+m=-l, i+2*m=-1); 
i := i+2#*m 
end; 
{het array a kan nog een aantal elementen bevatten; 
dit aantal is kleiner dan 2 * m} 
if i+m-1 < n 
~ then {in het overblijvende stuk komt nog één 
volledig m-tal voor (plus nog een stuk)} 
merge(a,h,i,i+m-1,n) 
else {ten hoogste één volledig m-tal, niets méér} 
for t := { ton do h[t] := alt] 


end 


Nu nog de procedure merge. 


procedure merge(var a,h: rij; o,m,p: integer); 
{voor pre- en postconditie: zie boven} 
var i,j,k,t: integer; 
begin i := O; k.:= O0} j := mti; 
inv.:{de elementen van a met indices o,O+t1,...,i-1 
zijn samengevoegd met de elementen van a met 
de indices mt+1,mt2,...,j-1 in het array h op 
de plaatsen met indices o,o+1,0+2,...,k-1 en 
er geldt: h[o] < h[o+1] < h[o+2] < ... <S 
< h[k-1]} 
while (i <= m) and (j <= p) do 
begin if ali] <= alj] pe 
then begin h[k] := alil; i: 
else begin hlk] := aljl; j: 
k := k+1 


i+1 end 
j+1 end; 


end; 
{er kunnen nog elementen over zijn in één van de 
trajecten; deze toevoegen: } 
while i <= m do 


begin h[k] := a[i]; i := i+1; k := k+1 end; 
while j <= p do 
begin h[k] := aljl; j. := j+1; k s= k+1 end 
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De repetitie in de procedure mergesort maakt bij een array ter lengte 
n, zoals we gezien hebben log n slagen. In iedere mengslag worden 
alle elementen van het array a in het array h gezet; dit kost dus n 
slagen. Voor het totale algoritme geldt dus A(n) = W(n) = O(n *log n). 
Een nadeel van dit algoritme ten opzichte van heap sort en quick sort 
is dat er een hulparray h bij wordt gebruikt. 

In de procedure voegen we steeds twee trajecten uit a samen tot 
een traject in h. Daarna wordt h gekopieerd in a. We zouden ook 
afwisselend van a naar h en van h naar a kunnen werken. 

Het mergeproces is erg eenvoudig recursief te formuleren: 


procedure mergesortrec(var a: rij; %,u: integer); 
pre: 2-5 ù 


post: alt] S aiT s ;.-s alu} 
var m: integer; 
Bs TLJ? 


begin if k < u 
then begin m := (%+u) div 2; 
mergesortrec(a,9%,m); 
mergesortrec(a,mt1,u); 
merge(a,h, £,m, u); 
for i'se T- tö n do afi] := hli] 
end E RE AEI 


end 


In plaats van het werken met een vaste lengte van de trajecten, 
waarbij de lengte steeds twee maal zo groot wordt, zou er ook gewerkt 
kunnen worden met een lengte die variabel is. Er wordt dan gebruik 
gemaakt van een eventueel reeds aanwezige sortering in deelrijen 

van het totale array. Als bijvoorbeeld bij de eerste slag van het algo- 
ritme blijkt dat a[1..4] en a[5..7] al gesorteerd zijn, worden deze 
deelrijen samengevoegd in h[1..7]. Het algoritme dat zo ontstaat 
wordt de natural merge genoemd (zie hoofdstuk 7). 

De Shell sort is ook een algoritme waar gesorteerde deelrijen 
worden samengevoegd. Het samenvoegen gebeurt daar echter door 
een sorteerslag en niet een mengslag. Vandaar dat Shell sort een 
grotere complexiteit heeft dan de merge sort. Een nadeel van de 
merge sort is het extra array. 
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4,11 RADIX SORT 


Alle algoritmen die we tot nu toe bekeken hebben, maakten van geen 
andere kennis gebruik dan dat het basistype geordend is. De algo- 
ritmen zijn dan ook allemaal gebaseerd op het vergelijken van waar- 
den (en voor dit soort algoritmen geldt F(n) = O(n *log n)). Als we 
iets meer weten van de te sorteren waarden, kunnen we daar wel- 
licht gebruik van maken om het sorteerproces te versnellen. 

Een voorbeeld van zo'n algoritme is de radix sort, die gebaseerd 
is op het feit dat de ordening, die tussen de te sorteren waarden 
bestaat, lexicografisch is. 


N.B. Tussen waarden bestaat een lexicografische ordening als de 
waarden opgebouwd zijn uit rijtjes (deel)waarden waarvoor 
een ordening bestaat. Voor twee waarden X = XkXk-1--. X0 


en y = YkYķ-1 +.. Yg geldt x < y als 
(Ei:kz iz0:x;< yi^ (Ajik j>i:x, = y;)). 


Voorbeelden van waarden waartussen een lexicografische orde- 
ning bestaat zijn rijtjes karakters (strings, namen, woorden) 
en rijtjes cijfers (bijvoorbeeld integers). 


We bespreken hier de radix sort voor integers. Stel dat we van de 
te sorteren waarden xj (1 <i <n) weten dat 0 < xj < 10-1 voor een 
of andere waarde m. We nummeren de cijfers van iedere getalwaarde. 
Gegeven de beperking in de grootte bestaat elk getal uit m cijfers, 
eventueel beginnend met een aantal nullen. Dus g = Cm Cm-1.». 
..C2C1. We verdelen de te sorteren getallen in 10 deelrijen. De je 
deelrij (0 <i <9) bestaat uit die getallen waarvoor geldt dat c1 =i. 
Deze deelrijen plaatsen we achter elkaar, waarbij eerst de getallen 
komen van deelrij 0, dan die van deelrij 1, enzovoort. De totale rij 
wordt nu opnieuw in 10 deelrijen verdeeld, maar nu op grond van cg. 
We zorgen er bij deze nieuwe opdeling voor dat, als de waarden p en 
q nu in dezelfde deelrij terechtkomen, maar bij de vorige deelrij- 
indeling in verschillende rijen zaten (zeg p in deelrij i en q in deel- 
rij j met 0 <i<j <9), in de nieuwe deelrij p dan komt voor q. We 
plaatsen de deelrijen weer achter elkaar en verdelen de zo ontstane 
totale rij weer in 10 deelrijen, nu op grond van c3. De onderlinge 
volgorde van de getallen in een deelrij is weer afhankelijk van de 
deelrijen waar deze getallen bij de vorige verdeling toe behoorden 
(zoals zojuist voor p en q aangegeven). Dit proces wordt herhaald 
voor alle posities in de getallen, in totaal dus m maal. Steeds geldt 
dat, als p en q nu in dezelfde deelrij voorkomen, p vóór q komt als 
bij de laatste verdeling, waarin ze niet in dezelfde deelrij voork wa- 
men, p in een deelrij zat met een lager nummer dan het nummer van 
de deelrij waarin q zat. Als deze opdelingen gedaan zijn voor alle 
posities, dan is de rij gesorteerd. 
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Neem bijvoorbeeld m = 3. Als p = 100*a+10*b+cen q = 100 *d + 
+ 10*e+f twee getallen zijn uit de te sorteren rij getallen, dan zal p 
in een eerdere deelrij voorkomen dan q als a < d. Als ze in dezelfde 
deelrij voorkomen (a = d), dan komt p voor q als b < e of als b =e 
endet, 

We werken de procedure radixsort hier niet verder uit. Aange- 
zien we de lengte van de deelrijen niet kennen zouden we, omdat we 
nog geen dynamische datastructuren kennen, slechts kunnen werken 
met arrays ter lengte n, en zodoende 10 * n plaatsen gebruiken voor 
de - in totaal - n waarden. We zullen radixsort bespreken in hoofd- 
stuk 5, waar we het gereedschap hebben om de deelrijen als ketting 
te representeren en aldus precies n plaatsen gebruiken. 

We beschouwen wel vast de efficiëntie van radix sort. In totaal 
zal op m cijfers gesorteerd worden. Het sorteren van de n getallen 
op 1 cijfer vergt n slagen. Er geldt dus W(n) = O(m*n), maar omdat 
m een constante is, geldt in feite W(n) = O(n). 


4.12 AFSLUITING 


Tot nu toe zijn we ervan uit gegaan dat voor het basistype de gewone 
relatie-operatoren gebruikt konden worden. Kan dit niet, dan moet 
voor het vergelijken van twee waarden een functie worden gemaakt 
die in de body van de sorteerprocedure wordt aangeroepen. 
Stel dat gesorteerd moet worden 
var x: arrayl1..nl of blok; 


met 


type blok = record lengte, breedte, hoogte: integer end; 


Als ordeningsrelatie voor het type blok zou gedefinieerd kunnen zijn 
x ‘komt voor! y 
(x en y van het type blok) als geldt 


X.lengte * x.breedte * x.hoogte < 
y.lengte x y.breedte * y.hoogte 


Deze ordeningsrelatie zou vastgelegd kunnen worden in de functie 
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function komtvoor(a,b: blok): boolean; 
pres: true 
post: komtvoor (a,b) = a komt voor b} 
begin komtvoor := a.lengte + a.breedte * a.hoogte < 
b.lengte « b.breedte +*+ b.hoogte 
end 


Het is nu niet moeilijk om de sorteerprocedures zodanig aan te passen 
dat blokken gesorteerd kunnen worden. We zouden ook nog algeme- 
nere sorteerprocedures kunnen maken als van polymorfie gebruik 
gemaakt kan worden. 

Als in een Pascal-programma twee arrays met verschillend basis- 
type gesorteerd moeten worden, zouden we twee verschillende sor- 
teerprocedures moeten declareren. In 1.6 is aangegeven hoe 'alge- 
mene! procedures dit probleem kunnen oplossen (polymorfie; let wel: 
dit is geen standaard-Pascal!). 

Ook zagen we in hoofdstuk 1, op bladzijde 20, hoe procedures 
gedeclareerd kunnen worden voor een ‘algemeen! indextype, zodat ze 
voor arrays met verschillende indextypen aangeroepen kunnen wor- 
den (conformant arrays: dit is wel standaard-Pascal, maar niet in 
elke implementatie gerealiseerd! ). 

Als voorbeeld van deze twee generalisaties verwijzen we naar het 
voorbeeld op pagina 40. 


In de sorteerprocedures zijn steeds de waarden van plaats gewisseld 
als dat nodig was. Stel echter dat de te sorteren objecten 'grote'! 
records zijn (uit veel componenten bestaan). Dan is het daadwerke- 
lijk verplaatsen van de records een kostbare zaak wat de tijd betreft. 
We kunnen dan een array van wijzers introduceren: 


var w: arrayl1..nl of 1..n; 


met als bedoeling dat bij verwisselingen de wijzers naar de records 
van waarde wisselen en niet de records zelf van plaats wisselen. 
In de eindtoestand betekent 


wlil = j 


dat het record a[j] op de ie plaats komt in de sortering. We zullen 
als voorbeeld het algoritme van de insertion sort bekijken, waarbij 
we ervan uit gaan dat in het array a records staan waarvan de volg- 
orde bepaald moet worden die deze records hebben op grond van de 
waarde van een component die we key zullen noemen. 


for i s= 1 ton do wfij := i} 
i := 1; min := alfi].key; p := 1; 
while i <> n do 
begin i := i+1; 
if a[i].key < min 
then begin min : 


alil.key; p := i end 
end; 
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w[1] := p; wlpl := 1; 
{het record op plaats p komt in de sortering op de eerste 
plaats; sentinel voor het plaatsen} 


keke 
{inv.: alw[1]].key £< alw[2]].key < ... s alw[i]].key} 
while i <> n do | 
begin i := it1; 
x ¿= afwlills-h ze wlil: j :=-h; 
while x.key < alwlj-1]].key do 
begin wlj] := wlj-1l; j := j-1 end; 
wli] := h 
end 


Zouden we een procedure schrijf hebben voor het afdrukken van 
een record, dan zouden de records uit het array in de volgorde van 
hun component key kunnen worden afgedrukt door: 


fot viel to n do schrijf(alwl ill) 


4,13 OPGAVEN 


1. Een sorteeralgoritme wordt stabiel genoemd als de onderlinge 
volgorde van gelijke waarden tijdens het sorteerproces behouden 
blijft. 

Welke van de gegeven algoritmen zijn stabiel? 


2. Geef de codering voor brick sort. 

3. Geef de codering voor cocktail sort. 

4. Geef de codering van de Shell sort voor een willekeurige waarde 
van de bovengrens van het array (2 1). Neem als toekenning aan 


de variabele inc (in plaats van inc := inc div 2) 


inc ses (5% inc ~i IX div li 


5. Schrijf een procedure voor de natural merge. 


6. De aangeduide procedure radixsort begint met het cijfer van de 
eenheden van de getallen, daarna het cijfer voor de tientallen, 
enzovoort. Kan het ook andersom? 


T. Schrijf een van de sorteerprocedures zodanig om dat de proce- 
dure gebruikt kan worden voor arrays met verschillende compo- 
nenttypen en verschillende indextypen. 
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8. Het hierna volgende probleem komt onder andere voor bij het 
implementeren van verzamelingen in een lineair geheugen. 
We willen nagaan of een verzameling A deelverzameling is van een 
andere verzameling B. De elementen van beide verzamelingen zijn 
gehele getallen. Beide verzamelingen worden gerepresenteerd in 
een array. 


Gegeven: 
const m = sss ? 
n= ; 


var A: arrayl1..ml of integer; 
B: arrayl1..nl of integer; 


De constanten m en n, en de variabelen A en B, hebben een 
waarde en wel zodanig dat geldt: 

- m<n 

= (Aij: 1lSismalsjsm:(Alij= Alj]l >i =j)) 

— CAL jt ESES RA Ì j< n : (B[i}] = B[j] »i=j)). 


WA 


Met andere woorden, er geldt: 


- het aantal elementen in de verzameling A is kleiner dan het 
aantal elementen in verzameling B; 

- voor array A geldt dat alle elementen verschillend zijn; 

- voor array B geldt dat alle elementen verschillend zijn. 


Gevraagd: Bepaal op drie verschillende manieren, die hierna 
worden gespecificeerd, of alle elementen in verzameling A voor- 
komen in verzameling B. 

Leg het resultaat vast in: 


var p: boolean; 
Met andere woorden, geef p een zodanige waarde dat geldt: 
p = (Ai: 1sism: (Ej: l1sjsn:A[il = B[jD). 


Tevens dient de efficiëntie (uitgedrukt in het aantal handelingen) 
van de te construeren programma's bepaald te worden. 


a. Schrijf een Pascal-programma dat bovenstaande eindrelatie 
realiseert, waarin de arrays A en B niet gesorteerd worden en 
waarbij geen hulparray gebruikt wordt. 

Bepaal de orde van dit programma. 
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b. Schrijf een Pascal-programma dat bovenstaande eindrelatie 
realiseert, waarbij eerst zowel array A als array B in stijgende 
volgorde gesorteerd worden, en waarbij geen hulparray ge- 
bruikt wordt. In het programma dient gebruik gemaakt te 
worden van het feit dat beide arrays gesorteerd zijn. 

Bepaal de orde van dit programma. 


c. Schrijf een Pascal-programma dat bovenstaande eindrelatie 
realiseert, waarin array A niet gesorteerd wordt en het array 
B wél in stijgende volgorde gesorteerd wordt, en waarbij geen 
hulparray gebruikt wordt. 
Bepaal de orde van dit programma. 


d. Evalueer in het kort de efficiëntie in tijd en geheugengebruik 
van de geconstrueerde programma's. 


DEEL 2 


5 DATATYPERING 


5.1 INLEIDING 


Het typebegrip speelt in veel programmeertalen een belangrijke rol 
met als principe: iedere variabele, constante en expressie is van één 
bepaald type. Door het type zijn de waardenverzameling en de ope- 
raties vastgelegd. 

Type-informatie kan op een aantal manieren gebruikt worden: 


- de leesbaarheid van programma's kan verbeterd worden door het 
gebruik van bij het op te lossen probleem passende typen; 

- het systeem kan een controle uitvoeren op typeconsistentie bij 
bijvoorbeeld een assignment statement of bij de parameterover- 
dracht bij procedures; 

- het systeem kan een optimale representatie kiezen voor de waar- 
den. 


Voor de programmeur zijn uiteraard vooral de eerste twee punten 
van belang. | 

We onderscheiden enkelvoudige en samengestelde typen. Bij 
enkelvoudige typen is een waarde op het niveau van beschouwing 
één geheel en niet opgebouwd uit delen. Zo stelt 372 één waarde 
voor. Daarentegen wordt bijvoorbeeld een punt in het platte vlak 
gekarakteriseerd door een waardenpaar: de x- en de y-coördinaat. 
Dit zou een voorbeeld kunnen zijn van een samengestelde waarde. 
Een waarde van een samengesteld type bestaat uit een aantal, een 
samenstel van, zogenaamde componentwaarden. Een componentwaarde 
kan een enkelvoudige waarde zijn of zelf weer uit componenten 
bestaan. Een waarde die een punt uit het platte vlak voorstelt 
bestaat uit twee componenten. Een waarde die persoonsgegevens 
voorstelt in een bepaalde toepassing zou kunnen bestaan uit de com- 
ponenten: naam, adres en geboortedatum, waarbij de laatste compo- 
nent op zijn beurt zou kunnen bestaan uit drie componenten: jaar, 
maand en dag. 

Een type kan behoren tot een klasse gelijksoortige typen: typen 
waarvan de waardenverzamelingen op een zelfde wijze zijn gedefini- 
eerd. We zeggen in zo'n geval dat de typen een zelfde structuur 
hebben. Zo zijn er veel typen te bedenken waarvan de waarden 
paren van waarden zijn, zoals bij de punten in het platte vlak. 
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Voor alle in dit hoofdstuk te bespreken typen geldt dat de 
assignment (x := y) en de test op gelijkheid (if x = y then ...) 
gedefinieerd zijn. a 

Een type kan geordend zijn, dat wil zeggen dat, naast de gelijk- 
heidsoperatoren = en #, de relatie-operatoren <, <, > en 2 gedefini- 
eerd zijn. De waardenverzameling kan opgevat worden als een rij 
(geordende) waarden. Voor geordende typen zouden als operaties 
ook gedefinieerd kunnen zijn (T is de naam van het type, Wr de 
bijbehorende waarden verzameling): 


— min(T) 
levert de kleinste waarde uit Wr; 

— max(T) 
levert de grootste waarde uit Wr; 

= ard(x) 
als x € Wy, dan levert ord(x) het plaatsnummer van x in de rij 
van waarden uit Wp, waarbij de telling van de waarden bijvoor- 
beeld met 0 zou kunnen beginnen; 

BMC) 
als x € Wr en x £ max(T), dan levert de functie de opvolger van 
x in de rij waarden van WT; 

- pred(x) 
als x E€ Wp en x f min(T), dan levert de functie de voorganger 
van x in de rij waarden van Wr. 


Bij het werken met waarden en typen kunnen drie niveaus onder- 
scheiden worden: 


1. Het niveau van specificatie, 
De eigenschappen van de benodigde waarden en de operaties 
daarop worden (formeel) beschreven. 

2 Het algoritmische niveau. 
Op dit niveau wordt ervan uit gegaan dat het type (de waarden- 
verzameling en de operaties) aanwezig is in het programmeerge- 
reedschap. 

3. Het implementatieniveau. 
Op dit niveau wordt het type, als het niet aanwezig is in het pro- 
grammeergereedschap, gerealiseerd met de in het programmeer- 
gereedschap ter beschikking staande hulpmiddelen. 


Voor de programmeur is het algoritmische niveau het belangrijkst. 
Voor de oplossing van een probleem wordt een nieuw type of een 
nieuwe structuur geïntroduceerd als daarmee deze oplossing eenvou- 
diger is te formuleren (eenvoudiger dan wanneer het nieuwe type of 
de nieuwe structuur niet wordt gebruikt). Ook de eigenschappen 
van de nieuwe structuur of het nieuwe type worden vastgelegd: de 
specificatie. Voor het uiteindelijke programma moet de nieuwe struc- 
tuur of het nieuwe type nog geimplementeerd worden en de bijbeho- 
rende operaties moeten gerealiseerd worden. Bovendien zal moeten 
worden aangetoond dat de implementatie voldoet aan de specificatie. 
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Stel dat we op het algoritmische niveau de waardenverzameling V 
introduceren met daarop de operatie P. Het effect van P zal in een 
specificatie moeten worden vastgelegd. Als in de te gebruiken pro- 
grammeertaal geen type voorkomt dat de waardenverzameling V heeft, 
zullen we dit type moeten implementeren. 

Stel dat we de implementatie van een waarde a € V aangeven met 
I(a) en dat het resultaat van P(a) volgens de specificatie b (€ V) 
oplevert. We zullen dan op het implementatieniveau een operatie P' 
moeten vinden waarvoor geldt P'(I(a)) = I(b). 


algoritmisch e at a 
niveau | 
implementatie- 
; e——— moe 
niveau I(a) p! P'(I(a)) 


Dit is de bewijsverplichting die we hebben ten aanzien van de imple- 
mentatie. We komen er in hoofdstuk 6 op terug. 


In de meeste programmeertalen zijn standaard enkele enkelvoudige 
typen in de taal opgenomen: de waardenverzamelingen en de opera- 
ties zijn gedefinieerd. In enkele talen is het mogelijk nieuwe enkel- 
voudige typen te definiëren. Zo zijn er in Pascal twee manieren om 
nieuwe enkelvoudige typen vast te leggen (enumeratie en deelinter- 
val). Het is echter in Pascal alleen mogelijk om de waardenverzame- 
ling vast te leggen, het is niet mogelijk om bij zo'n nieuw type spe- 
cifieke operaties te definiëren. Wel zijn enige operaties in de taal 
opgenomen voor elk type dat volgens een van deze manieren is gedefi- 
nieerd. In de meeste programmeertalen zijn ook mogelijkheden aan- 
wezig om nieuwe samengestelde typen te definiëren. Zo kennen de 
meeste programmeertalen wel de zogenaamde arraystructuur. Voor 
alle typen met deze structuur geldt dat de waarden verzameling op 
dezelfde manier gedefinieerd wordt en dat de componentwaarden op 
een zelfde manier uit een samengestelde waarde kunnen worden 
geselecteerd. In een programmeertaal als Ada is nog een aantal 
andere gemeenschappelijke operaties gedefinieerd voor typen met 
een zelfde structuur (bijvoorbeeld het opvragen van de kleinste en 
grootste index van een array). Er zijn slechts enkele programmeer- 
talen waarin het mogelijk is om voor een nieuw type met een bepaalde 
structuur specifieke operaties te definiëren. In Pascal bijvoorbeeld 
is dit niet mogelijk. 

In de volgende paragrafen worden de typen in Pascal behandeld. 
Daarbij zal de nadruk liggen op pointers, omdat die voor implemen- 
taties gebruikt worden in volgende hoofdstukken. Niet aan de orde 
komen de files en de sets, omdat ook die in volgende hoofdstukken 
aan de orde komen. 
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5.2 TYPEN IN PASCAL 


5.2.1 Inleiding 


De standaard enkelvoudige typen in Pascal zijn de typen integer, 
real, boolean en char. De waardenverzamelingen van de typen real, 
integer en char worden bepaald door de implementatie (van het 
Pascal-systeem). De in 5.1 genoemde operaties zoals max en suce 
bestaan slechts gedeeltelijk. Zo bestaat voor het type integer de 
constante maxint die als waarde heeft de bij de implementatie beho- 
rende grootste waarde van het type integer. Voor de typen integer 
en char bestaan ook de functies succ en pred. En voor het type 
char bestaat de functie ord. 

Een aparte plaats nemen de pointertypen in. We gaan hier uitvoe- 
rig op in in 5.2.4. Deze typen zijn vooral van belang bij het imple- 
menteren van andere gewenste typen. 

Als structuren voor het definiëren van samengestelde typen kent 
Pascal bijvoorbeeld de arraystructuur en de recordstructuur. Naast 
de selectie van componenten kent Pascal voor typen van deze struc- 
turen alleen de assignment als operatie. We komen op deze typen 
terug in 5.2.3. 


5.2.2 Nieuwe enkelvoudige typen 


De twee mogelijkheden in Pascal voor het definiëren van nieuwe 
enkelvoudige typen zijn: enumeratie (opsomming) en interval (sub- 
range). 

Bij een enumeratietype wordt de (geordende) waardenverzameling 
vastgelegd door een opsomming van de waarden (die identifiers moe- 
ten zijn). Voorbeeld: 


type kaartkleur = (klaveren,ruiten, harten, schoppen) ; 


Voor alle via enumeratie gedefinieerde typen zijn als operaties aan- 
wezig (naast de assignment en de relatie-operaties): succ, pred en 
ord. Er kunnen geen specifieke operaties gedefinieerd worden anders 
dan met behulp van procedures en functies. De ordening is vastge- 
legd door de opsomming. Zo is klaveren ‘kleiner! dan harten. 

Hebben we in een algoritme bovenstaand type gedefinieerd, dan 
kunnen variabelen van dit type gedeclareerd worden: 


var kk: kaartkleur; 


Het type kan ook direct in de declaratie van een variabele opgenomen 
worden (maar krijgt dan geen naam waaraan later gerefereerd kan 
worden): 
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var kl: (rood,geel,groen,blauw); 


Na de definitie van het type en de declaratie van variabelen van het 
type kunnen de toegelaten operaties op waarden en variabelen van 
het type worden uitgevoerd. 

Bij het definiëren van een intervaltype wordt de waardenverzame- 
ling vastgelegd door van de waardenverzameling van een reeds 
bestaand (geordend) type (dit kan een van de standaardtypen zijn, 
maar niet het type real) twee waarden op te geven die de kleinste en 
de grootste waarde van het nieuwe type vormen. 


Voorbeeld 
type cijfer = Wr.. t91 


Het type cijfer is een subtype van het type char. De waardenverza- 
meling bestaat uit tien waarden. ® 


Op waarden van een intervaltype zijn de operaties gedefinieerd van 
het ‘omvattende! type. Voor het type cijfer zijn dat dus de operaties 
van het type char. 

Na de definitie van een type kunnen variabelen van dit type 
gedeclareerd worden : 


var C€: cijfer; 


Het type kan ook direct in de declaratie van de variabelen worden 
opgenomen : 


var j: 1900..2000; 


Opmerking 


Het is in Pascal niet mogelijk om onderscheid te maken tussen een 
waarde van een intervaltype en de overeenkomstige waarde van het 
omvattende type. Het zou de voorkeur verdienen om de naam van 

het type te gebruiken in de notatie van een constante, zodat er 
onderscheid zou kunnen zijn tussen char('5') en cijfer('5'). ® 


5.2.3 Samengestelde typen 


Voor het definiëren van samengestelde typen stelt Pascal de array-, 
de record-, de set- en de filestructuur ter beschikking. In latere 
hoofdstukken komen we terug op de settypen en op de filetypen, we 
beperken ons nu tot de array- en de recordtypen. 
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DE ARRAYSTRUCTUUR 


Bij een type met een arraystructuur zijn alle componenten van het- 
zelfde type en worden de componenten van elkaar onderscheiden met 
behulp van de waarde van een zogenaamde index. Deze index is ook 
van een bepaald type. Het arraytype wordt vastgelegd door het 
noemen van het componenttype en het indextype. De waarde van een 
arraytype kunnen we opvatten als een afbeelding van het indextype 
in het componenttype. We kunnen een type met een arraystructuur 
dus met vrucht gebruiken als we een verband willen leggen tussen 
twee verzamelingen; in de definitie van het type nemen we de ene 
verzameling als de waardenverzameling van de index en de andere 
verzameling als de waarden verzameling van de componenten. Met een 
array kunnen we ook een rij van vaste lengte representeren (afbeel- 
ding van een interval van gehele getallen, de plaats, in het type van 
de rij-elementen). 

Over het algemeen zal het indextype een type zijn dat door opsom- 
ming of als een subrange gedefinieerd is. 

Stel dat we de afbeelding F hebben: 


FDR 
Als type in een algoritme noteren we dit als: 


type F = arraylD] of R 


De typen D en R moeten reeds eerder gedefinieerd zijn; D is het 
indextype (domeintype) en R het componenttype (het rangetype). 
Stel dat gedefinieerd zijn 


type loket = (a,b,c); 
situatie = (bezet,vrij); 


dan kunnen we definiëren: 


type loketbezetting = arraylloket] of situatie; 


De waardenverzameling van het type loketbezetting bestaat uit 
23 = 8 waarden. Elk van deze waarden stelt een mogelijke situatie 
voor bij de drie loketten. 

In Pascal is het niet mogelijk om een waarde van het type loket- 
bezetting in een algoritme te noteren als een constante. Een moge- 
lijke notatie voor een van de waarden zou kunnen zijn: 


loketbezetting((a,bezet), (b,vrij), (c,bezet)) 
Mogelijke operaties op 


var lbl,1b2: loketbezetting; 
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zijn: 


selectie van een component: 1b1[a] 
{het beeld van a: de situatie bij 
loket a (een waarde van het type 
situatie) } 


toekenning SDI ve D2 
(omdat het in Pascal niet mogelijk 
iseen constante te noteren is een 
andere toekenning op het niveau 
van de variabelen niet mogelijk; 
wel op het componentniveau:) 
Ipsfal te vrij 


test op gelijkheid HEDDE a 4bh2 
lb2[b] = bezet 


Opmerking 


In de verdere tekst zullen we een waarde (of een variabele) van een 
type met een arraystructuur vaak een array noemen. Ook bij typen 
met een andere structuur zullen we de naam van de structuur vaak 
gebruiken om een variabele (of een waarde) aan te duiden. e 


Het is mogelijk dat het componenttype op zich weer samengesteld is 
(en bijvoorbeeld een arraystructuur heeft). Zo kunnen we introdu- 
ceren: 


type domein = 10,.150; 
meting = arrayldomein] of real; 
maandmeting = arrayl1..12] of meting; 
direct = array[1900..2000] of arrayldomeinl of real; 


Een variabele d van het type direct bestaat uit 101 componenten. 
De component d[1984] is een array. Hiervan kan weer een component 
geselecteerd worden: d[1984][75]. 

Het is ook toegestaan een samengesteld domein te nemen: 


type samen = array[1900..2000, 10..150] of real; 


Als s nu een variabele is van het type samen, wordt een component, 
van het type real, geselecteerd met behulp van twee indices, bij- 
voorbeeld s[1984,75]. We noemen s een tweedimensionaal array. Wil- 
lekeurig veel dimensies zijn toegestaan. 


Een veel voorkomend gebruik van de arraystructuur is de vastleg- 
ging van een rijtje objecten. Het indextype is dan een interval van 
de verzameling der natuurlijke getallen (met vaak 1 als ondergrens). 
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type rij = arrayl1..10] of real 


Zo worden vectoren en matrices gerepresenteerd met behulp van de 
arraystructuur. 


Samenvatting: 


type F = arraylDl of R; 


W 
waardenverzameling: We = Wo 
w‚l 
aantal elementen _ : |Wp] = Wa | 
var Et f4 
selectie : f[d] (is een element van Wp als d € Wp? 
toekenning : f[d] :=r (metr € Wp?) 


test op gelijkheid: f[d] = r 


DE RECORDSTRUCTUUR 


Bij de arraystructuur zijn alle componenten van hetzelfde type. Het 
komt ook vaak voor dat een samengestelde waarde bestaat uit compo- 
nenten die niet allemaal van hetzelfde type zijn. 

Stel dat de volgende typen gedeclareerd zijn: 


type dag = 1..31; 
maand = 1..12; 
jaar = 1901..2000; 


Deze drie typen gebruiken we voor de definitie van een nieuw type 
met een recordstructuur: 


type datum = record d: dag; 
pisan m: maand; 
j: jaar 
end; 


Een waarde van het type datum bestaat uit drie componenten. Een 
record mag uit willekeurig veel componenten bestaan. Het type van 
een component mag op zich weer samengesteld zijn (in het voorbeeld 
zijn de componenttypen enkelvoudig). 

In Pascal kan weer geen constante van een recordtype genoteerd 
worden. Eigenlijk zou als notatie gebruikt moeten worden: 
datum(9,6,1984). In Pascal is dus ook geen toekenning mogelijk op het 
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niveau van records, afgezien van het toekennen van de waarde van 
de ene variabele aan de andere: d1 := d2 (dl en d2 van het type 
datum). 

In de definitie van het type worden ook de selectoren opgegeven 
waarmee de componenten geselecteerd kunnen worden. Deze selecto- 
ren zijn identifiers. Als dateen variabele van het type datum is, 
kunnen de drie componenten op de volgende wijze geselecteerd wor- 
den: 


dat.d van het type dag 
dat.m van het type maand 
ARR van het type jaar 


In Pascal is, naast de bovengenoemde assignment, alleen de selec- 
tieve toekenning, de toekenning waarbij slechts één component van 
waarde verandert, mogelijk; bijvoorbeeld: 


dat.d := 10 
Nog een voorbeeld: 


type geslacht = (man, vrouw); 
burgstaat = (ongehuwd, gehuwd ,weduw, gescheiden); 


Met deze enkelvoudige typen en het samengestelde type datum kun- 
nen we nu definiëren: 


type persoon = record naam : arrayl[ 1..80] of char; 
_gebdat: datum; 
gesl : geslacht; 
bs : burgstaat 
end; 
var p: persoon; 
p.gesl := man; p.gebdat.d := 13 


Samenvatting: 


type R = record sj: T4; 


S92: Ta; 
Sn: Th 


end 


waardenverzameling: Wo = We * fT. a CE Thi 
(het cartesisch produkt van de waarden- 
verzamelingen van de componenten) 


aantal elementen ć : [Wp] = (Win x KA bais ip 
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var V: R}; 
selectie : V.S; (is een element van Wr.) 
toekenning : V.Sj := W (met wE Wp.) 

i 


test op gelijkheid: v.s; =w 


HET VARIANTE RECORD 


Stel dat de typen persoonsnaam en datum gedefinieerd zijn en dat we 
verder gedefinieerd hebben: 


type persoon = record naam: persoonsnaam; 
gebdat: datum; 
haarkleur: (blond,zwart,grijs); 
nationaliteit: (nl,anders) 
end; 


We willen nu, afhankelijk van de nationaliteit, andere componenten 
in het type opnemen. Daarbij willen we over één type beschikken. 
Dit kan in Pascal met een zogenaamd variant record. 


type nationaliteit = (nl,anders); 
persoon = record naam: persoonsnaam; 

gebdat: datum; 

haarkleur: (blond,grijs,zwart); 

case nat: nationaliteit of 
nl: (gebplaats: plaatsnaam); 
anders: (gebland: landnaam; 

imdat: datum) 
end; 


Een waarde van het type persoon bestaat, afhankelijk van de waarde 
van de component nat, uit 5 of 6 componenten. Als de waarde van 
nat nl is, zijn dit de componenten naam, gebdat, haarkleur, nat en 
gebplaats; is de waarde van nat anders, dan zijn het de componen- 
ten: naam, gebdat, haarkleur, nat, gebland en imdat. De naam van 
de componenten op grond waarvan het onderscheid wordt gemaakt 
in het variante record, wordt het tag field genoemd. Als voor een 
bepaalde waarde van het tag field geen specifieke componenten 
behoeven te worden opgenomen in het record, wordt dit aangegeven 
met een zogenaamde lege lijst; bijvoorbeeld: m: ( ). 

Bij het werken met variante records is voorzichtigheid geboden, 
want men zou een component een waarde willen geven, terwijl die 
component niet bestaat bij de waarde die het tag field dan heeft. 
Het is aan te bevelen om bij het werken met variante records steeds 
gebruik te maken van de case statement: 
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case p.nat of 

nl: begin p.gebplaats := ... end; 

anders: begin p.gebland := ...; p.-imdat := ... end 
end; 


Als we met een recordvariabele gaan manipuleren moet elke compo- 
nentnaam steeds weer vergezeld gaan van de naam van de variabele. 
Pascal kent hiervoor een afkortingsmogelijkheid: de with statement. 
Voor het bovenstaande voorbeeld zouden we met de with statement 
kunnen schrijven: 


with p do 
begin naam := ...}; 
gebdat := ...; 
haarkleur «:= .….…; 
case nat of 
nl: begin gebplaats := ... end; 
anders: begin gebland := ee ij 
imdat := s,s 
end 
end 
re 


De waardenverzameling van het variante deel van een record is de 
disjuncte vereniging van de waardenverzamelingen behorende bij de 
alternatieven. Stel dat het volgende type is gedefinieerd: 


type union = record case tag: boolean of 
true : (i: integer); 
rarsst (C? châr) 
end; 


Voor de waardenverzameling W geldt: 


union 


wW = {(true,a) | a€ W } U {(false,‚b) | bE Ww] 


union integer char 


We schrijven dit wel als 


W =W +W 


union integer char 


Voor het type 


type R * reord sy: Ti; Bat Fos sse? Siel: Til? 
case sj: Tj of 
Wy: (Sj, 1: T1,17 IMr 2127 ef “daka? ARA 


Wj: (Sj 1: Ti 10 Sj 2: Ts 2 bd Sik: Fik.) 
end; J J 
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geldt dan: 
Wp = W * W Eaa Wik 
R Ti To T1 
x ((W x . * W )-+ + (W Kes wi )) 
Tii e S Tfi T 


5.2.4 Pointertypen 


We zullen hier vrij veel aandacht besteden aan pointers omdat ze het 
gereedschap vormen waarmee veel datatypen en datastructuren geim- 
plementeerd kunnen worden. 

Een typedefinitie als 


type p = îtbasistype; 


definieert een type waarvan de waardenverzameling bestaat uit ver- 
wijzingen naar waarden van het (reeds gedefinieerde) basistype. 
Deze waarden zijn anoniem: er is niet of nauwelijks mee te manipule- 
ren. 

Laten we uitgaan van de definitie: 


type intpoint = tinteger; 


De declaratie 


var p,q: intpoint; 


introduceert twee variabelen p en q die verwijzingen naar integers 
als waarden zullen hebben. Er zijn drie mogelijkheden om aan dit 
soort pointervariabelen een (anonieme) waarde toe te kennen: 


“aip SRI 
nil is de enige expliciete waarde van elk pointertype met als inter- 
pretatie: p wijst naar 'niets'; 

- new(p) 
Er wordt een variabele geïntroduceerd van het type integer 
(omdat p naar integers zal verwijzen volgens de declaratie). Deze 
variabele krijgt de naam pt. Bovendien krijgt de variabele met de 
naam p als waarde: de verwijzing naar pt (deze waarde is ano- 
niem!). Aan de integer waarde waar p naar wijst kan dus gerefe- 
reerd worden door pt. Schematisch kunnen we dit resultaat weer- 


geven als: 


p: intpoint pt: integer 
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(Het resultaat van new(p) voor de variabele p+ wordt voor een 
‘normale! integer variabele impliciet gerealiseerd bij de declaratie 
van die variabele. Voor de variabele p realiseert new(p) een 
waardetoekenning. ) 

TEM 
De variabele p krijgt als waarde: de waarde van q; p en q heb- 
ben na afloop dezelfde waarde. De waarde waarnaar verwezen 
wordt is qt (= pt). Als van tevoren geldt 


We er SE 
q p | 
dan geldt na afloop van de assignment 


PE a S 


De waarde y (integer) is via p niet meer bereikbaar. 

Elke wijziging van de waarde van q+ (pt) heeft nu dezelfde wij- 
ziging van pt (qt) tot gevolg; pt en q* zijn verschillende namen 
voor dezelfde variabele (aliasing). 


Een variabele als pt kan in een algoritme elke rol vervullen die een 
andere variabele van het type integer kan vervullen. Als a een 
integer variabele is, dan is dus een assignment als pt := a legaal. 
Ook is natuurlijk pî := qt toegestaan. Als de waarden van p en q 
vóór uitvoering van de assignment statement pt := gt verschillen, 
dan verschillen ze ook erna. Als vooraf bijvoorbeeld geldt 


dan geldt na afloop 
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De statement new(p) heeft als 'tegenhanger' de statement dispose(p): 
de waarde van p is ongedefinieerd en p+ bestaat niet meer. Als voor 
uitvoering van dispose(p) geldt p = q, dan is na afloop de oor- 
spronkelijke waarde van pt niet meer 'bereikbaar'; ook qt bestaat 
niet meer en de waarde van q is ongedefinieerd. Het gebruik van 
ongedefinieerd pointerwaarden ('dangling pointers!) is gevaarlijk en 
en te allen tijde fout! 


Pascal staat via pointers recursie toe in typedefinities. Zo kunnen 
we definiëren 


type element = record w: integer; p: telement end; 


Een waarde van het type element bestaat uit twee componenten, de 
ene component is een integer, de andere component is een verwij- 
zing naar een waarde van het type element. Vanuit een record- 
waarde kan dus verwezen worden naar een recordwaarde; vanuit 
deze recordwaarde weer naar een recordwaarde, enzovoort. Op deze 
manier kunnen we een rij records maken waarbij elk record, afge- 
zien van het 'laatste', verwijst naar een opvolger; de waarde van de 
verwijzing van het laatste record is nil. Zo'n geketende rij van 
records wordt wel een ketting of een lineaire lijst genoemd. 


(In de tekening wordt de waarde nilaangegeven met een kruis.) 
De bovenstaande ketting kunnen we op de volgende wijze reali- 
seren. We introduceren: 


var r,q: telement; 


Als de ketting al voor een deel gerealiseerd is, waarbij r wijst naar 
het ‘voorste! record (de records in een ketting worden wel de scha- 
kels van de ketting genoemd), kan aan deze voorkant een nieuw 
record (een nieuwe schakel) met de 'waarde! k voor de eerste com- 
ponent worden toegevoegd door middel van: 


new(q); qf.w := k; qt.p := r; Fr := q 


Voor het algoritme voor het opbouwen van de ketting nemen we als 
invariant : 


- r#is de als laatste toegevoegde schakel 
- k is de eerstvolgende toe te voegen waarde 
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Zo krijgen we voor de opbouw van de gehele ketting: 


r ¿snil k e= n; 
while k > 0 do 
begin new(q); dqtiw er Kr gtep err; 
{qt is toegevoegd} 
r := q; {invariant voor rt geldt} 
k := k-1 {invariant voor k geldt} 
end 


We bekijken nu nog een aantal operaties op kettingen. We gaan uit 
van het eerder gedefinieerde type element en van de variabelen x, 
yen z, gedeclareerd als: 


var x,y,z: telement; 


Stel dat we in een ketting met schakels van het type element een 
extra schakel, aangewezen door de pointer y, willen toevoegen 
‘achter! de schakel in de ketting die door de pointer x wordt aange- 
wezen. 


Dit kan als volgt: 


yt pi i= xt. Di ktep te y 


Het toevoegen van een element, aangewezen door y, vóór het element 
aangewezen door x, kan als volgt: 


nNew(z)y ZAE fe. Rts ATD TE Brite w a yt W) 
x := Z; dispose(y) 


We kunnen de stappen als volgt in beeld brengen: 
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new(z); zt := xt 


Ktp: ye Zi eW yt,w 


Het bovenstaande effect kan ook bereikt worden met: 


B:s xt.w;s XTW s= yt.w;s Yt.W s:= hj 
Utp te Xip tp := yj x ls y 


Het verwijderen van het element, dat de opvolger is van het ele- 
ment aangewezen door x, kan met: 
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zes xtp; xt.p is zt.p; disposez) 


X 
X Z 
X Z 
X 


Als voorbeeld kijken we naar een mogelijkheid van geheugenregis- 
tratie. 
We stellen het geheugen van een computer voor met behulp van 


type adres = 0..N-1; 
var geheugen: arrayladres] of woord; 


waarin het type woord reeds gedefinieerd is. 

Dit geheugen wordt gebruikt voor het werken met rijen van waar- 
den, die consecutief in een rij geheugenwoorden worden opgeslagen. 
De trajecten van woorden die hiervoor gebruikt worden, worden na 
verloop van tijd weer vrijgegeven. Om nieuwe trajecten te kunnen 
toewijzen, moet bijgehouden worden waar en hoeveel vrije ruimte 
beschikbaar is. We doen dit met behulp van een ketting met scha- 
kels van het type - 


type ruimte = record plaats: adres; 
omvang: integer; 
link: truimte 
end; 


plaats geeft het eerste adres van een vrij traject, omvang de 
grootte van het traject en link is de pointer naar de schakel die 
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het volgende vrije traject karakteriseert. We veronderstellen dat de 
ketting gesorteerd is op adres, dat wil zeggen dat, als p4.link = q 
(4 nil), p*.plaats < q+.plaats is. 

Stel dat we zo'n ketting hebben. Als er nu een traject van n 
woorden moet worden toegewezen, hoe vinden we dan een vrij tra- 
ject in de ketting? Er zijn twee bekende methoden voor het zoeken 
van vrije ruimte: best-fit en first-fit. Bij de eerste methode wordt 
in de ketting gezocht naar een schakel waarvoor geldt dat deze de 
kleinste waarde van omvang heeft die ten minste n is. Bij de tweede 
methode wordt gezocht naar de eerste schakel met een omvang die 
ten minste n is. 

We bouwen een ketting zodanig op dat de ketting naast de scha- 
kels die vrije ruimte aangeven, nog twee extra schakels bevat. 
Deze noemen we header en trailer en het zullen de eerste, respec- 
tievelijk de laatste schakel van de ketting zijn. We gebruiken de 
header en de trailer om het zoeken in de ketting te vereenvoudigen. 
Van de header is alleen de 1ink- component van belang. Van de 
trailer is de link-component gelijk aan nil; de omvang-component 
wordt bij het zoeken steeds aangepast om het stoperiterium bij het 
zoeken te vereenvoudigen (het is een zogenaamde sentinel). 

De declaraties voor de zoekalgoritmen zijn: 


var avail: Aruimte; {pointer naar header} 
~ end : Aruimte; {pointer naar trailer} 

p,q : *ruimte; {q is de pointer naar de eerstvolgende 
te onderzoeken schakel; steeds geldt 
pt.link = q; door de header is dit ook 
bij initialisatie mogelijk} 

a : adres; {geeft na afloop van het zoeken het 
beginadres aan van het vrije traject 
ter lengte n} 


Als alle ruimte nog vrij is, kan de ketting gecreëerd worden door: 


new(avail); new(end); endt.link := nil; 
new(p); pt.plaats := 0; pt.omvang := N; 
pt.link := end; availft.link := p; 


Het first-fit algoritme voor het vinden van vrije ruimte (en het aan- 
passen van de ketting) luidt: 


endt.omvang := n; 
p := avail; q := pt.link; 
{inv.: schakels 'voorafgaande' aan qt geven trajecten met onvol- 
doende omvang weer; pt.link = a} 
while gqt.omvang < n do begin p := q; q := pt.link end; 
{(q*.plaats is adres van het eerste verie traject dat groot genoeg 
is) v (q = end, d.w.z. er is geen vrij traject dat groot genoeg 


is) } 


128 Voortgezet programmeren 


qt.omvang = n; 
= 0 then begin pt.link := qt.link; 
as=qt.plaats; dispose(q) 


if q <> end then begin k := 
if: k 


end 
else begin qt.omvang := k; 
a := qħî.plaats + k 
end 


end 
else 'geen vrij traject met omvang 2 n'; 


Als deze ketting gedurende lange tijd bestaat en gebruikt is, zullen 
de eerste schakels waarschijnlijk kleine omvang-componenten heb- 
ben. De ketting moet dan steeds verder afgezocht worden om een 
voldoende groot, vrij traject te vinden. (Het zoeken begint steeds 
bij de header!) De ketting zou tot een circulaire ketting omgevormd 
kunnen worden door de trailer niet op te nemen en de laatste (echte) 
schakel te laten verwijzen naar de eerste (echte) schakel. De 
header wijst dan na elke zoekactie naar de schakel die de opvolger 
is van de schakel waar de vorige zoekactie geëindigd is. 

Om niet te veel kleine stukjes over te houden (schakels met een 
kleine omvang-component), die waarschijnlijk toch geen kandidaat 
zullen zijn bij een zoekactie, zou bij het zoeken een omvang, die 
precies n is óf een omvang waarvoor geldt dat omvang -n ten minste 
gelijk is aan een van tevoren vastgestelde grenswaarde, als selectie- 
criterium kunnen gelden. 


Nu het best-fit algoritme. De hierbij gebruikte invariant luidt: 


(m is het minimum van de omvang-componenten die ten 
minste n zijn van de schakels voorafgaande aan qłt) A 
(st.omvang =m) a (s = r4. link) 


s legt de plaats vast van de minimale waarde die ten minste n is en 
r wijst naar de voorganger. 


p := avail} g := pt. link} 

mies Ny- Sra nily r te Dil? 

while q <> end do 

begin if (qt.omvang>=n) and (qt.omvang < m) 
~ then begin m := qħ.omvang; r := p; S := q end; 
pes Q) G I= pt. link 


end; 
ifs Snil 
then begin {er is een minimum gevonden} 
k := st.omvang - n; 
if k = 0 then begin Tt. link := st.link; 
a s=st.plaats; dispose(s) 
end 


Datatypering 129 


else begin st‚omvang := k; 
a := st.plaats + k 
end 


end 
else 'geen vrij traject met omvang 2 n' 


Voor dit algoritme geldt dat de totale ketting wordt doorzocht, ook 
als er reeds een q met qt.omvang = n is gevonden. Vanzelfsprekend 
zou het zoeken dan gestopt kunnen worden. 


In beide algoritmen hebben we gewerkt met een ketting die gesor- 
teerd is op plaats (als p4‚link = q A q4.link # nil dan p4.plaats < 
qt.plaats). We zouden ook een ketting kunnen nemen die gesorteerd 
is op omvang (pt.omvang < qt+.omvang). Hoe gaan de algoritmen 
dan luiden? 


We hebben nu naar de algoritmen gekeken voor het vinden van een 
traject van vrije ruimte. We kijken nu nog naar een algoritme voor 
het opnemen van een traject van vrije ruimte, ter grootte n en 
beginadres a, in de ketting. Allereerst moet de plaats van de scha- 
kel voor deze vrije ruimte gevonden worden. Daarna moet nagegaan 
worden of deze vrije ruimte aansluit bij de vrije ruimte die door de 
buurtschakels wordt aangegeven. 


p := avail; q := p+.link; 

{inv.: plaatscomponenten van schakels voorafgaande aan qt zijn 
kleiner dan a} 

endt.plaats := a; {sentinel} 

availft.plaats := -1; availt.omvang := 0; {fictieve waarden} 

while qt.plaats < a do begin p := q; q := pt.link end; 

la*.plaats 2 a} 


new(r); rt.plaats := a; rt‚omvang := n; rî.link := q; pt.link := r; 
if qt.plaats = (a+n) 
then begin rt.omvang := rÎ.omvang + q#.omvang; 
rî.link := qt.link; dispose(g) 
end; 
if (pt.plaats + pf.omvang) = a 
then begin pt.omvang := pt.omvang + rħî.omvang; 
pt.link := rt.link; dispose(r) 
end 


In 4.11 is de radix sort geïntroduceerd. Daar werd al gezegd dat 
we de deelrijen zouden representeren met behulp van kettingen. We 
geven nu direct het algoritme. 
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procedure radixsort(var a: rij; m: integer); 
{pre: m2 la (Airi sisn:0 sali} s 107 - 1) 
A{Ai:lsásnsafij= Xi) 
post: (a[1] < a[2] < ... < a[n]) A (a[1..n] bevat permutatie van 
X4 X2 ««« Xn)} 
type element = record w: integer; 
p: telement 
end; 
var start: array[0..9] of telement; 
eind: array[0..9] of telement; 
p‚q: telement; 
i,k,j,ma,h: integer; 
begin k := 1; ma.:= 1; 
{inv.1l: (de verdelingen op grond van c1,C2,..-,Ck-1 Zijn gemaakt) A 
ma = 10k-1} 
while k<= m do 
begin for i := 0 to 9 do begin start[i] := nil; 
eind[i] := nil 


end; 
dte dd 
Lid 2: ali},al2},...,alj-1} zijn in 'hun' deelrij 
geplaatst } 
while j<=n do 
begin ged qt.w := alj]; qt.p := nil; 
(aljl div ma) mod 10; 
‚B Pr ef = nil 
then begin start[h] := q; eind[h] := q end 
else begin efndfuit.p := q; eindlh]:= Ke end; 
FAME S 
end; 
(alle elementen staan in een deelrij op grond van hun c K? 
i := 0 jee l. 
erie de deelrijen 0,1,2,3,...,i-1 zijn teruggeplaatst 
in al1..j-1]} 
while i <= 9 do 
begin q := start[i]; 
while q <> nil do 
begin alj] : = qgħt.w; j := j+l; 
p := q; q := qt.p; 
dispose (p) 
end; 


end 
end 


Met pointers hebben we een grote vrijheid in het bouwen van struc- 
turen. Een bekende structuur is de dubbel geketende ketting: 
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Een tweede bijzondere ketting is de circulaire ketting: 


Uitgaande van een willekeurig element kan de hele ketting worden 
doorlopen. (Zie voor een toepassing de opmerkingen na het first-fit 
algoritme.) 

Als laatste bijzondere kettingstructuur willen we nog de combina- 
tie van bovenstaande twee kettingen noemen: de dubbel geketende 
circulaire ketting. 


5.3 HET GEBRUIK VAN POINTERS 


Een datastructuur die veel gebruikt wordt voor de representatie 
van gegevens is de uit de wiskunde bekende binaire boom. Een 
binaire boom is leeg of een binaire boom bestaat uit een zogenaamde 
wortel en twee binaire bomen (die eventueel iii kunnen zijn). Een 
binaire boom kunnen we tekenen als: 


In deze boom is A de wortel en de twee zogenaamde subbomen heb- 
ben de wortels B en C. De binaire boom met wortel B heeft twee 
subbomen waarvan een de wortel D heeft. Deze subboom heeft twee 
lege subbomen. 

Binaire bomen kunnen bijvoorbeeld gebruikt worden om arithme- 
tische expressies te representeren. De binaire boom op bladzijde 132 
bovenaan representeert de expressie (atb/c)*(d-exf). In een wortel 
staat steeds de operator, de subbomen stellen de operanden voor. 
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Een binaire boom kan in Pascal voorgesteld worden met behulp 
van records en pointers. 


De representatie in Pascal kan met behulp van: 
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type knooppunt = record w: T; 
left,right: “knooppunt 
end; 
var wortel: Aknooppunt; 


Een waarde van het type knooppunt representeert één zogenaamd 
knooppunt en niet de totale binaire boom, precies zoals een waarde 
van het type element in het voorafgaande één schakel represen- 
teerde en niet de hele ketting. 

Stel dat er een invoerrij is gegeven van de volgende gedaante: 
<N,X1:X2,...,Xņ> De n geeft het aantal gehele waarden aan dat nog 
volgt. Deze n waarden willen we opnemen in een binaire boom (het 
zijn de waarden voor de n knooppunten van de boom). Het maken 
van een boom uit een rij knooppunten kan op veel manieren. De bij- 
komende eis die we hier stellen is echter dat de boom, wat genoemd 
wordt, gebalanceerd is, Dat wil zeggen dat voor elk knooppunt 
geldt dat de absolute waarde van het verschil tussen het aantal 
knooppunten in de linker subboom en het aantal knooppunten in de 
rechter subboom ten hoogste 1 is. Het gevraagde kunnen we reali- 
seren met behulp van: 


type ref = tnode; 
node = record k: integer; l,r: ref end; 
var n: integer; 
root: ref; 
function tree(p: integer): ref; 
{pre: p 2 0, invoerrij (globaal) bevat ten minste 
p waarden 
post: tree wijst naar gebalanceerde boom van de 
(eerste) p waarden uit de invoerrij} 
var nn: ref; 
ve nln: integer; 
begin if p = 0 then tree := nil 


else 

begin nl :=p div 2; nr t= penl=l; 
new(nn); 
nnt.l := tree(nl); 
read(x); 
DREA e= £j 
nnđ.r := tree(nr); 
tree := nn 

end 

end; 
begin read(n); root := tree(n)}; ... 


Een bijzondere vorm van de binaire boom, die veel gebruikt wordt, 
is de zogenaamde binaire zoekboom. De waarden in een binaire zoek- 
boom zijn zodanig in die boom opgenomen dat de linker en rechter 
subbomen ook binaire zoekbomen zijn. Alle waarden in de linker 
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subboom zijn kleiner dan de waarde van de wortel en alle waarden 
in de rechter subboom zijn groter dan de wortel. 

Een functie voor het nagaan of een waarde e voorkomt in de 
binaire zoekboom kan luiden: 


function komtvoor(b: ref; e: integer): boolean; 
‚pre: b is binaire zoekboom 


post: komtvoor(b,e) = 'e komt als waarde voor in b'} 
begin if b = nil 
~ then komtvoor := false 
else if e = bî.w 
~ then komtvoor := true 
else if e < bî.w 
~ then komtvoor := komtvoor(bt.l,e) 


else komtvocr := komtvoor(bt.r,e) 


end 


Een andere realisatie (met iteratie) zou kunnen zijn: 


funetion komtvoor(b: ref; e: integer): boolean; 
var gevonden: boolean; 
fra T ref; 
begin p := b; gevonden := false; 
{gevonden = 'e komt voor in het onderzochte 
deel van b'} 
while (p <> nil) and not gevonden do 
if pti +e o pay 
then gevonden := true 
else if e < pt.w 
then p := pt.l 
else p := pt.r; 
komtvoor := gevonden 


end 


Het toevoegen van een waarde aan een binaire zoekboom gebeurt 
door de waarde te vergelijken met de waarde van de wortel en de 
waarde toe te voegen aan de linker subboom als de waarde kleiner 
is dan de wortel en de waarde toe te voegen aan de rechter sub- 
boom als de waarde groter is dan de wortel. We zullen in de onder- 
staande procedure bij een gelijke waarde een teller bij de betref- 
fende wortel met 1 ophogen. Als we een binaire zoekboom opbouwen 
uit een rij waarden, dan zal de vorm van de boom afhangen van de 
volgorde van de waarden binnen de rij. Zo zal de rij 7,2,9,6,1,8,3, 
4,5 leiden tot de zoekboom 
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Voor het toevoegen van één waarde aan een binaire zoekboom gaan 
we uit van het type 


type knooppunt = record key: integer; 
teller: integer; 
left,right: tknooppunt 
end; 


Een procedure voor het toevoegen kan dan luiden: 


procedure insert(k: integer; var p: 4knooppunt); 
pre: p wijst naar een binaire zoekboom 
post: k is opgenomen; p wijst naar de (uitgebreide) 
binaire zoekboom} 
begin if p = nil 
then begin new(p); pt.key := k; pt.teller := 1; 
pt.left ;= nil; pt.right := nil 
end 
else if k = pt.key 
then pf.teller := pt.teller +1 
else if k < pt.key 
then insert(k,‚pt. left) 
else insert(k,pt.right) 
end 


We kunnen dit probleem ook niet-recursief aanpakken. De boom 
wordt doorlopen tot de waarde gevonden wordt of tot de subboom, 
waarin de waarde zou kunnen voorkomen, leeg is. In het laatste 
geval moet in de gevonden subboom (die leeg is) de waarde k wor- 
den opgenomen. We moeten op dat moment echter nog wel weten of 
we in een linker of rechter subboom terecht zijn gekomen. We kun- 
nen dit bijvoorbeeld oplossen door te introduceren: 
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var p,q: fknooppunt; 
bd PGE, 


Voor p, q en d (vastlegging afkomst) geldt de volgende invariant: 


(k < qt.key A (p = qt.left A d = -1)) v 
(k > qt.key A (p = qf.right A d = 1)) V 
(k = qt.key A d = 0) 


pt is het te onderzoeken record waarbij q wijst naar de 'vader' van 
pt; is p+ de 'linker' zoon dan geldt d = -1, is p+ de 'rechter' zoon 
dan geldt d = 1. 

Om de invariant direct voor de repetitie te laten gelden voeren 
we een knooppuntwaarde (©,0,b,‚nil) in met de naam root, waarin 
b staat voor de pointer naar de binaire boom waarin de waarde k 
moet worden opgenomen. 


q := root; p-:=qtslefbs d s=rlj 
while (p <> nil) and (d <> 0) do 
begin q := p; 
if k < qt.key 
then begin p s= qi.deft;.d = -I end 
else if k > qt.key 
~ then begin p := qt.right; d := 1 end 


else d := 0 
end; 
{invariant A (d = 0 yv p sonir)? 
ifd=0 


then qt.teller := qt.teller +1 
else begin new(p); pî.key := k; pt.teller := 1; 
pt.left s= nil; pt.right := nil; 
if d = =1 then qt.left.;= p 
else qt.right := p 


end 


In veel toepassingen wordt een binaire boom afgelopen om op elk 
knooppunt een bepaalde operatie uit te voeren. Er zijn drie 
(standaard) volgordes om een binaire boom af te lopen: 


W 


W: wortel 
L: linker subboom 


R: rechter subboom 


Deze volgordes kunnen we aangeven als: 


Datatypering 


pre-order : W- 
in-order : L- 
post-order: L-R-W 


L-R 
W-R 


De linker en rechter subboom worden weer in dezelfde volgorde 
doorlopen. Voor de binaire boom die de arithmetische expressie 
voorstelde (zie bladzijde 132) krijgen we als volgorde van de knoop- 
punten: 


pre : *+a/be-dx*ef 
a atb/ex*d-e tf 
post: abe/tdef e- + 


Deze notaties voor de expressie worden de prefix-, infix- en postfix- 
notatie genoemd. 

De pre-order volgorde kunnen we bijvoorbeeld krijgen met behulp 
van de procedure (waarbij op elk element de operatie P uitgevoerd 
moet worden): 


procedure preorder(t: tknooppunt); 
begin if t <> nil 
~ then begin P(t); {bijv. write(tt.k)} 
preorder(tt.1); preorder(tt.r) 
end 
end ZE 


De andere twee volgordes gaan analoog. 


Het zoeken van een waarde in een binaire zoekboom gaat snel. Stel 
dat we de waarde 27 zoeken in onderstaande boom. 
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Het zoeken gaat alleen dan snel als de boom niet gedegenereerd is 
tot een ketting. Als de binaire zoekboom gebalanceerd is geldt voor 
het zoekalgoritme: O(log n), als n het aantal knooppunten is. 


Pointers worden onder andere gebruikt om andere typen en structu- 
ren te implementeren. Hoe moeten implementaties gaan luiden als we 
in een taal werken waarin geen pointers, zoals die in Pascal, voor- 
komen? Typen en structuren die met pointers opgebouwd worden 
kunnen veelal ook gerealiseerd worden met behulp van arrays. Een 
consequentie is wel dat we in dat geval geconfronteerd zullen wor- 
den met de beperking dat arrays een van tevoren bekende lengte 
moeten hebben (zoals in Pascal), waardoor bijvoorbeeld (de imple- 
mentatie van) een ketting niet willekeurig groot kan worden. Als 
voorbeelden van het gebruik van arrays zullen we kettingen en 
binaire bomen als type (met een reeds gedefinieerd basistype) bekij- 
ken. 

We gaan uit van de definities: 


type element = record w: basistype; 
p: telement 
end; 
ImBb = ‘element; 
var q: ImBb; {eerste schakel van de ketting} 


We introduceren: 


type elem = record w: basistype; 
de Osvomax 
end; 
var ruimte: arrayl1..max] of elem; 
start: 0..max; 


Pointerwaarden worden voorgesteld door indices in het array ruimte. 
De waarde 0 van de i-component van het type elem representeert 

de waarde nil van de p-component van het type element. Dit geldt 
ook voor start en q. De andere pointerwaarden zijn anoniem. We 
spreken af dat ruimte[j] de representatie is van q+ als ruimtel[j].w = 
=qt.w en ruimte{ruimte[j}.ij de representatie is van qt.pt. 
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Voorbeeld 


_ = nn ne 


NAD 3 4 <o $ 7 8 9 
pepe oe ELN 
EE eee 


Hiermee kunnen we de algoritmen op kettingen rechtstreeks omzet- 
ten naar algoritmen met arrays: 


- element toevoegen aan ketting voor element aangewezen door s 
(en er is een q met q4.p = s) 


new(r) 
Kion ze Ry ffp ze Sj qt.p 2e t} 
q := r 


- element toevoegen aan implementatie van ketting voor het element 
op plaats si (en er is een qi met ruimtel[qi].i = si) 


‘vind index j van vrije plaats'; 
ifj=0 
then ‘overflow! 


else begin ruimteljl.w := k; 
ruimteljl.i := si; 
ruimtelgil.i := j; 


o E Dunk” | 
end 


Als we met het array ruimte gaan manipuleren (toevoegen en verwij- 
deren van elementen van de ketting), zullen we bij moeten houden 
welke componenten van ruimte nog vrij zijn (in verband met de 
operaties 'new' en 'dispose'). Daartoe zouden we kunnen introduce- 
ren: 


var vrij: O..max; 
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De variabele vrij is de index van het eerste element van (de imple- 
mentatie van) de ketting van 'vrije' componenten van ruimte. Het 
initialiseren van de ketting van vrije componenten, voordat de 
‘echte! ketting elementen bevat (start = 0) kan met: 


for j := max-1 downto 1 do ruimteljl.i := j+1; 
ruimtelmax].i := 0; 
yrij te l 


Als de 'echte' ketting bestaat (start # 0) kunnen we het algoritme 
voor het opnemen van een element met de waarde a van het basis- 
type 'vooraan' in de ketting (zie hiervoor) schrijven als: 


h := yrijy vrij iš ruimtelriji.i; 
ruimtelhl.w := a; ruimtelhl.i := start; 
start := D 


Dit kan alleen als het aantal elementen kleiner is dan max (dit is 
vast te stellen doordat h ongelijk 0 is na de toekenning h := vrij). 


We kunnen in één array ook meerdere kettingen realiseren. Stel dat 
we n kettingen in array 


var G: array[1..N] of record w: integer; 
ke GoxN 
end; 


willen representeren. De kettingen breiden alleen uit. Ze worden 
genummerd van 1t/mn. 


Voorbeeld n = 5 


as debat er A A 
z0] of of ofo}z1jafs} 3} af 2} 2} 1j 2} 5 
|s| sjujz|ojojojojojej jio] sofa 


et 
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Het initialiseren van het array kan als: 


for i. := 1 to N do Gli] := (0,0); 


i := n+1 {eerste vrije plaats voor kettingelement } 


Voor het toevoegen van waarde k aan ketting p (1< p < n) krijgen 
we dan: 


Gl4law se k; Glij.l j= Glpl.l; elpl.l += i; 
i := i+] 


Het gebruik van arrays voor de representatie van binaire bomen 
kan op dezelfde manier als voor kettingen. We gebruiken dan: 


type element = record w: basistype; 
J‚r: Os.max 
end; 
var ruimte: array[1..max] of element; 
~ binboom: 0i max? ug 


We kunnen een binaire boom ook anders representeren in een array 
door voor elke subboom (en de boom zelf) een zodanig element te 
kiezen voor de representatie van de wortel dat alle elementen van 
de linker subboom in arrayplaatsen komen met een index kleiner dan 
die van de wortel en dat alle elementen van de rechter subboom in 
arrayplaatsen komen met een index groter dan die van de wortel. 


5.44 OPGAVEN 


Voor de opgaven 1 en 2 is het type element gedefinieerd door: 


type element = record waarde: integer; 
volgende: telement 
end 


1. Gegeven is een ketting met elementen van het type element. 
Het begin van de ketting wordt aangegeven door de variabele 
p: telement. Maak een procedure die de volgorde van de elemen- 
ten in de ketting omkeert. 


2. Gegeven zijn twee kettingen met elementen van het type element. 
De beginschakels van deze kettingen worden aangegeven door de 
variabelen pj en Pz: telement. De waarden in de elementen zijn 
monotoon niet-dalend geordend. 

Maak een procedure die deze twee kettingen samenvoegt tot één 
monotoon niet-dalend geordende ketting. 
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3. Een dubbel geketende ketting kan gerealiseerd worden met ele- 
menten van het type dubbel, gedefinieerd door: 


type dubbel = record volgende: tdubbel; 
waarde: integer; 
vorige: fdubbel 
end; 


Geef de code van de volgende procedures: 


verwijder (a,p) - verwijdert uit de ketting, aangewezen door a, 
het element pî; 


voegtoe(a,p,q) - voegt het element qt direct na het element p^t 
aan de ketting toe; 
verwissel(a,p) - verwisselt de elementen pt en pt. volgende + 


(4 nil) van volgorde. 


4, Binaire zoekbomen kunnen voorgesteld worden met behulp van 
records van het type bb, gedefinieerd als: 


type bb = record waarde: integer; 
aantal: integer; 
Tyr: tbb 
end; 


waarbij het veld aantal aangeeft hoe vaak de waarde voorkomt. 


a. Maak een procedure die een getal aan een zoekboom toevoegt. 

b. Maak een procedure die alle in een zoekboom voorkomende 
waarden met hun multipliciteit afdrukt. 

c. Gegeven is een invoerrij van positieve getallen, gevolgd door 
een 0. Maak een programma dat met behulp van een zoekboom 
en bovenstaande procedures de in de rij voorkomende posi- 
tieve getallen met hun multipliciteit afdrukt. 


5. Geef de procedures voor in-order en post-order. 
6. Polynomen van de vorm 
n f 
i 
) ax 
i 


1=0 


kunnen voorgesteld worden met behulp van records van de typen 
term en pol, gedefinieerd door: 
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type term = record co: integer; 
ex: integer 


end; 
pol = record t: term; 
next: fpol 
end 


waarbij het volgende geldt: 


- van alle schakels in de ketting is t.co # 0 
- de ketting is stijgend gesorteerd op de waarde van t.ex. 


Gevraagd worden functies voor het optellen, aftrekken en ver- 
menigvuldigen van aldus voorgestelde polynomen. 


1. We beschouwen een kring van m (m 2 1) objecten, die opeenvol- 
gend genummerd zijn van 0 t/m m-1. 
Onder een k-aftelling (k > 1) verstaan we het volgende: k opeen- 
volgende objecten in de kring worden afgeteld, en het laatst 
afgetelde object wordt uit de kring verwijderd. 
De eerste k-aftelling begint bij het object met nummer 0; elke 
volgende k-aftelling begint bij het object dat (in de kring) volgt 
op het laatst verwijderde object. 
Na m-1 k-aftellingen zal nog één object overgebleven zijn. 


Hierna volgen vijf oplossingsmethoden om, uitgaande van de 
waarden van m en k (m 2 1 Ak 2 1), het nummer van het laatst 
overgebleven object te berekenen. 


Gevraagd: Ontwerp voor elk van de vijf methoden een functie 
function aftelling(k,m: aantal): aantal; 


die het nummer van het laatst overgebleven object berekent 
(type aantal = 1..maxint). 


1° oplossing 
We kunnen de m objecten in de kring representeren met behulp 
van: 


var kring: arrayl0..m-1] of boolean 


waarbij kring[i] de waarde true heeft als het object met nummer 
i nog in de kring aanwezig is, en de waarde false als dat niet 
het geval is. 


2e oplossing 
De kring van (nog aanwezige) objecten kunnen we representeren 
met behulp van een circulaire ketting met elementen van het type: 
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type element = record nr: 0..m-1; 
w: telement 
end; 


3€ oplossing 

De (nog aanwezige) objecten zijn (in de juiste volgorde) vastge- 
legd in kring[0],kring[1],...,kring[aant-1] waarin aant het aan- 
tal nog aanwezige objecten in de kring is. Hiertoe wordt gebruikt: 


var kring: array[0..m-1] of 0..m-1; 
aant: 1..m; 


4e oplossing 
Met R(n,k) geven we aan: het nummer van het object dat in een 
kring van n objecten als laatste overblijft na n-1 k-aftellingen. 


Er geldt: 
R(l,k) = 0 
R(n,k) = (R(n-l,k) + k) mod n 


Op deze recurrente betrekking is een iteratieve oplossing te 
baseren. 


5€ oplossing 
Op de recurrente betrekking van de 4€ oplossing is ook een 
recursieve oplossing te baseren. 


8. Een sparse matrix is een matrix, waarvan een groot aantal ele- 
menten de waarde nul heeft. Uit efficiëntie-overwegingen met 
betrekking tot geheugenruimte worden sparse matrices niet 
gerepresenteerd met behulp van arrays. 

Geef een representatie voor sparse matrices waarin alleen de 
niet-nul elementen worden vastgelegd: 


type sparse = «ceeee 


Gegeven is nog dat het om m x n-matrices gaat (m en n vast en 
gegeven). De representatie moet zodanig zijn dat er een algoritme 
geschreven kan worden van O(h+k) voor het optellen van twee 
sparse matrices; hierin zijn h en k de aantallen niet-nul elemen- 
ten van de matrices. 

Schrijf ook een procedure: 


procedure telop(a,b: sparse; var c: sparse); 


die het optellen van twee matrices realiseert. 


Datatypering 145 


9. Een verzameling die een deelverzameling is van {1,2,...,n} kan 
worden geïmplementeerd door een geordende ketting met elemen- 
ten van het type: 


type elt = record v; 1..n; p: Aelt end; 


Dat een ketting geordend is wil zeggen: als a en b variabelen 

van het type telt zijn en er geldt at.p =b (b # nil), dan geldt 
ERN Cpt V, 

Voor het laatste record e van een ketting geldt et.p = nil. Een 
verzameling bevat alleen verschillende elementen. 


Notatie: De waarde van een verzameling wordt genoteerd met een 
hoofdletter. De waarde van een verzameling is toegankelijk door 
middel van een variabele, aangeduid door de corresponderende 
kleine letter, van het type 4elt, die wijst naar het eerste record 
van zo'n ketting; als de verzameling leeg is, is de waarde van 
die variabele nil. 


Voorbeeld: Als S = (81,59; ‚Sn} dan wijst 
var S: set; 

met 
type set = telt; 


naar het eerste record van de ketting waarin de waarden 
s1 t/m sn zijn opgeslagen. 
Als S = Ø dan geldt s = nil. 


Gevraagd: Ontwerp functies/procedures voor de volgende opera- 
ties op verzamelingen, uitgedrukt in operaties op kettingen 
(type element = 1..n;). 


a. {a = A} function leeg(a: set): boolean {leeg = (A = Q)} 


b. {a = A} function elementvan(x: element; a: set): boolean 
{elementvan = x € A} 


di ia 


= A Ab = B} procedure vereniging(var c: set; a,b: set) 
(CSR UB 


10. Niet-negatieve getallen in het decimale stelsel kunnen worden 
gerepresenteerd met behulp van datastructuren, zodanig dat 
ieder cijfer van het getal een element is van de datastructuur. 
Twee aldus gerepresenteerde getallen kunnen worden opgeteld. 
Het resultaat van de optelling dient op dezelfde wijze in een 
datastructuur te worden vastgelegd. 
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De getallen worden gerepresenteerd met behulp van een ket- 
ting. 


type digit = record cijfer: 0..9; p: tdigit end; 
type getal = tdigit; 


Construeer de functie som die de volgende heading heeft: 


function som(s,t: getal): getal; 


De functie som bepaalt de som van 2 niet-negatieve getallen die 
gerepresenteerd zijn met behulp van een ketting, en represen- 
teert het resultaat ook met behulp van een ketting. 


Voorbeeld: Stel s en t zijn waarden van het type getal. 

s is een lijst met achtereenvolgende waarden (6,4,5,9) en met 
getalwaarde 9546, en t is een lijst met achtereenvolgende waar- 
den (5,8,3,6) en met getalwaarde 6385 

Dan is het resultaat van de aanroep som(s,t) een lijst die de 
waarde 15931 voorstelt. 


. In een binaire boom kunnen een aantal verschillende natuurlijke 


getallen zijn opgeslagen. 
Stel dat gedefinieerd is het type 


type knoop = record g: integer; l,r: 0..N end; 


Voor iedere waarde k van het type knoop geldt: 


- iedere knoop bevat een getal (k.g); 

- de linker subboom van k (k.1) bevat alleen getallen die kleiner 
zijn dan g; | 

- de rechter subboom van k (k.r) bevat alleen getallen die gro- 
ter zijn dan g. 


Een boom waarvan de knopen aan bovenstaande definitie voldoen, 
is gerepresenteerd in: 


type tree = record wortel: 0..N; 
knopen: arrayl1..NI of knoop 
end; 


Voor iedere waarde t van het type tree geldt: 


- t.wortel bevat de index van de wortel; 

- voor een knoop die in t.knopen{[i] gerepresenteerd staat, 
geldt: 
. t.knopenlij.g bevat het getal behorende bij die knoop 
. t.knopenlij.l bevat de index van de linker subboom 
. t.knopenlil.r bevat de index van de rechter subboom 
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12. 


. als de linker (respectievelijk de rechter) subboom ontbreekt 
geldt: t.knopenl[i].l = 0 (respectievelijk t.knopenl[ij.r = 0); 
- als de boom leeg is geldt: t.wortel = 0. 
Gevraagd wordt een functie 


function present(a: integer; t: tree): boolean; 


die de waarde true aflevert dan en slechts dan als a voorkomt in 
de boom t. 


In deze opgave worden binaire bomen gerepresenteerd met 
behulp van pointers. Hierbij wordt gebruik gemaakt van het type 


type bb = trecord w: integer; l,r: bb end; 


Schrijf een procedure met als heading 
procedure list(b: bb) 


die de integer waarden in de binaire boom b afdrukt, niveau voor 
niveau vanaf de wortel naar de bladeren en binnen een niveau 
van links naar rechts. 

Voor 


is de volgorde van de waarden Salsola, id, oS, aii, KP 1e 
beschikbaar een procedure print(i) die de integer waarde i 
afdrukt. 


Hint: Het afdrukken van een boom kan beschouwd worden als een 
bijzonder geval van het afdrukken van een rij bomen. 


6 ABSTRACTE DATATYPEN EN 
DATASTRUCTUREN 


6.1 INLEIDING 


Stel dat gevraagd wordt om bij een gegeven waarde van n (geheel, 
2 2) alle priemgetallen te genereren die ten minste 2 zijn en ten 
hoogste n. Een bekend algoritme voor dit probleem is 'de zeef van 
Eratosthenes'. Dit algoritme is eenvoudig te formuleren met behulp 
van verzamelingen: 


x= {i EN 


bes take Pets Bj 
{inv.: (Ai: ifpais<min(x):iniet priem) A 
(Ai: iEp:ipriemaA 2 S i < min(x)) A 
(Ai iEx: = (j: jJ €p: i mod j=O0))} 
while x # Ø do 
begin k := min(x); 
insert(p,k); 
v := Kk} 


while v<=n do 
begin delete(x,v); 
v s= V+k 
end 
ec. 
fot art a write(i) 


De gebruikte operaties zullen voor zichzelf spreken. 

Stel nu dat we het algoritme moeten schrijven in een program- 
meertaal waarin het type 'verzameling' (met de gebruikte operaties) 
niet beschikbaar is. We kunnen dan proberen van waarden van 
andere typen gebruik te maken om de verzamelingen te simuleren 
(te implementeren). De operaties kunnen dan gerealiseerd worden 
door functies en/of procedures te declareren die werken op deze 
nu gebruikte typen. 

In de gesuggereerde aanpak wordt het probleem eerst op algorit- 
misch niveau opgelost, waarbij waarden kunnen optreden die deze 
probleemoplossing vereenvoudigen. Als de waarden niet als elemen- 
ten van een type voorkomen in de te gebruiken programmeertaal 
worden de waarden en de bijbehorende operaties op het implementa- 
tieniveau gerealiseerd. Vaak ziet men dat programmeurs de oplossing 
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direct proberen te formuleren voor het implementatieniveau, waar- 
door in het algoritme de eigenlijke probleemoplossing (in het voor- 
beeld het genereren van priemgetallen met de zeef van Eratosthenes) 
en de implementatie door elkaar lopen waardoor het overzicht verlo- 
ren gaat. 


Er kunnen meerdere andere typen in aanmerking komen om een ver- 
zameling van het algoritmische niveau te implementeren. Bij de keuze 
spelen efficiëntie-overwegingen met betrekking tot tijd en geheugen- 
gebruik een rol. We zullen later een aantal mogelijkheden voor de 
implementatie van verzamelingen bekijken. In het bovenstaande 
algoritme wordt de operatie delete het meest uitgevoerd. We zullen 
dan onze implementatie zodanig proberen te kiezen dat in ieder 

geval deze operatie efficiënt is te realiseren. 

We zouden de verzamelingen kunnen implementeren met behulp 
van een (ongesorteerd) array van integers met daarbij een extra 
integer die op elk moment aangeeft hoeveel elementen de verzame- 
ling bevat. Een mogelijke representatie van de (waarde van de) 
variabele x van 'het type verzameling' is dan een waarde van: 


var xim: record e: arrayl0..nl of integer; 
d: oN 
end 


waarvoor geldt: 


- a geeft het aantal elementen van x aan; 
- de elementen van x zijn e[0],e[1],e[2],... ‚ela-1] (met: 
(Ai,j:0<si,j<aa{ i+j:eli]# elj])). 


Hierbij moeten we ons realiseren dat verschillende waarden van xim 
dezelfde waarde van x kunnen representeren (omdat de volgorde 
van de elementen anders is). 

De representatie van x door xim moet voldoen aan: 


- een abstractiefunctie A (een afbeelding van de implementatie 
naar het te realiseren type), die een waarde van xim afbeeldt op 
een waarde van het te implementeren type (een waarde van x van 
het type 'verzameling'): 


Axim) = {xim.e[j] | 0 <j < xim.a} 


- een (eventuele) representatie-invariant R, die beperkingen oplegt 
aan de waarden van de representatie; in onze representatie hebben 
we ervoor gekozen dat alle elementen van het array e een andere 
waarde hebben (wat in het algemeen bij de representatie van een 
verzameling met behulp van een array niet noodzakelijk is): 


R: {Aij Os i,j < xim.a ni # j: xim.e[i] £ xim.e[j]) 
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Het element xim.el[n] wordt niet gebruikt voor de representatie van 
een element van de verzameling x; we zullen straks zien dat dit ele- 
ment als sentinel wordt gebruikt bij de operaties. 


Als we nu - in de vorm van procedures en/of functies - ook nog 
beschikken over de in het bovenstaande algoritme gebruikte opera- 
ties, dan kunnen we het algoritme coderen in Pascal. Daarvoor is 
echter nodig dat we het effect van de operaties exact vastleggen 
door middel van een specificatie. 


e {true} empty(xim) {R ^a A(xim) = Ø} 


- [R A A(xim) = x A 'aantal elementen van x' < n} 
insert(xim, i) 
{R A A(xim) = x U {i}} 


4 [R a A(xim) = x} 


delete(xim,i) 

{RA Alxim) =x \ {i}} 
ie {R A Alxim) = Xx} 

min(xim) 

{R A Alxim) = x A min(xim) = 'minimale element van x'} 
- {R A A(xim) = x} 

isempty(xim) 


{R A A(xim) = x A (isempty(xim) e (x = Ø))} 


Samen leveren deze de specificatie van de operaties. (Men noemt 
zo'n specificatie wel de abstracte modelspecificatie van het vast te 
leggen type.) Met de abstractiefunctie en de representatie-invariant 
kunnen we zo voldoen aan de in hoofdstuk 5.1 genoemde bewijsver- 
plichtingen. 


program zeef (output); 
const n = ess ž 
type set = record e; array[0..n] of integer; 
as E £ gou 
end; 
var X,p: set; 
v: integer; 
Ri Zeus 
procedure empty(var s: set); 
procedure insert(var S: set; t: integer); 


„es e … ee 
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function min(s: set): integer; 


begin empty(x); 


Vv := 2} 
while v<=n do 
begin insert(x,v); v := v+1 end; 
empty (p); 
while not isempty(x) do 
begin k := min(x); 
| insert(p,k); 
v := k; 
while v<=n do 
begin delete(x,v); v := v+k end 
end; RE 


while not isempty(p) do 
begin k := min(p); delete(p,k); write(k) end 


end. 


De bodies van de procedures en functies zijn niet uitgewerkt. Ook 
de pre- en postcondities zijn niet gegeven; deze staan aangegeven 
bij de specificatie. 


Soms zullen we operaties als procedures schrijven, omdat het in 
Pascal niet mogelijk is dat een functie een resultaat aflevert van een 
samengesteld type. Deze operaties, als procedures gerealiseerd, 
veranderen de waarde van hun argument en vernietigen dus de 
oorspronkelijke waarde. Normaliter is dit bij operaties niet het 
geval (denk maar aan optellen en aftrekken). Voor operaties als 
delete en insert is het heel gewoon dat hun argument verandert. 
Voor andere operaties, waarbij dit niet het geval is, genieten func- 
ties als operator dus duidelijk de voorkeur. In het vervolg zullen 
we ons dan ook vaak niet storen aan de beperking van Pascal en 
ook functies gebruiken die een resultaat afleveren van een samenge- 
steld type, tenzij we een 'echt' Pascal programma willen schrijven. 

De realisatie van de operaties in ons voorbeeld moet zodanig zijn 
dat de records op ieder moment (de goede) verzamelingen represen- 
teren. We leggen daartoe formeel, met behulp van de abstractie- 
functie, de relatie vast tussen de implementatie van een verzameling 
en de betreffende verzameling zelf. 

De abstractiefunctie legt de relatie vast tussen de waarden van 
het gebruikte type (in ons voorbeeld recordwaarden) en het te 
implementeren type (in ons voorbeeld waarden van verzamelingen). 
Het kan zijn dat er voor de implementatie bijzondere eisen worden 
gesteld aan de waarden van de gebruikte typen. Zo zouden we 
voor de implementatie van verzamelingen gebruik kunnen maken van 
gesorteerde arrays (in plaats van de niet-gesorteerde arrays zoals 
we in ons voorbeeld hebben gedaan). Zo'n extra eis aan de waarden 
van de gebruikte typen hebben we een representatie-invariant 
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genoemd. In het algemeen zullen we bij de implementatie van de 
operaties niet alleen moeten nagaan of de abstractiefunctie blijft 
gelden, maar ook of de representatie-invariant geldig blijft. 

Nu de operaties: 


procedure empty(var s: set); 

lore: truh ooo 

post: R A A(s) 
begin {true} 

Sa s:= 0 

{R a A(s) = Ø (uit assignment regel) } 


Ø} 


end; 


Voor insert en delete moet gezocht worden of i voorkomt; bij dit 
zoeken wordt s.e[s.a] als sentinel gebruikt. 


{RA A(s) = k} 

asefg-al := i; {sentinel; R A A(s) = k} 
j := 0; {invariant P} 

while s. el jl <> i Q0 Jee Jel 


[Ra A(s) =k AP} 


met P: 
j<ss.aans.els.al=i A (Ap:0 <p < j:s.elpl +i) 


Er geldt nu 
(j =s.a)®e (ik) 


procedure insert(var s: set; i: integer); 
{pre: RA A(S) = k A iki <n} 
post: RA Ala) sk Uf4k} 
var j: 0..n; 
begin {R ^ A(s) =k a Ikl < n} i 
gi ofA ade. ij | 
j := 0; while s.eljl <> i do j := j+1; 
ER ne ERAIKI Somia BE 
ifj SSA 
then {R(s.at1) A Al(s.e,s.a+ti)) = k U {i}} 
Ssa 2= Sarl 
iR A Als) = Kk Uii 


end; 


procedure delete(var s: set; i: integer); 
pre: R.A A(s) =k 
post: R a A(s) = kN{i}} 
var j: O..n; 
begin {R A A(s) k} 
Sels àl: i? 
j := 0; while s.eljl <> Ld 3 s= j+1; 
{RA A(s) =k A P} 
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EEJ >is 

“then begin {RA s.eljl = i Ai Eik a s.d > 0} 
s.eljl := s.els.a-1}; 
{R(s.a-1) A A((s.e,s.a-1)) = kN{i}} 
S.a ie- Sari] 

end 
IRA A(s) = kN{i}} 
end; 


function min(s: set): integer; 
{pre: RA A(s) =k 
post: RA A(s) = k A min(s) = minimum(k) } 
Mat j; “ieelip 
sekd integer; 
begin {R A A(s) = k} 
m= maxint; j := +1} {m = AMINi: 0S is j:s.elil)} 
while j <> (s.a-1) do rii 
begin j := j+1; IKA 
if s.eljl < m then m := s.eljl 
end; en 
{m = (MINi: Ós 1 < s.âäż1: 5.é[i])} 
min := m 
{R A A(s) = k A min(s) = minimum(k)} 
end; 


function isempty(s: set): boolean; 
(pre: RA Als) = k 


post: RA A(S) = k A (isempty(s) @ k = Ø}} 
begin {R ^A A(s) = k} 
isempty := (s.a = 0) 
{R A A(s) =k A (isempty(s) © k = Ø)} 


end; 


Deze declaraties moeten we invullen in het eerder gegeven skelet- 
programma om er een echt Pascal-programma van te maken. 


6.2 NIEUWE TYPEN EN STRUCTUREN 


De wijze waarop in 6.1 de set is geimplementeerd heeft een groot 
nadeel. De implementatie is niet 'veilig'. In het programma, waarin 
de typedefinitie voorkomt en de definities van de operaties met 
behulp van de procedures en de functies, kunnen ook andere ope- 
raties uitgevoerd worden op de recordwaarden dan die welke zijn 
vastgelegd in deze procedures en functies. Zo zou het je element 
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van de e-component een andere waarde kunnen krijgen door 

s.e[j] := 17. Hierdoor zou de abstractiefunctie en ook de represen- 
tatie-invariant niet verstoord behoeven te worden, maar het record 
stelt niet meer de juiste verzameling voor. 


We voeren een nieuwe notatie in die het probleem van de veiligheid 
oplost en die ons tegelijkertijd in staat stelt in een typedefinitie 
niet alleen de waardenverzameling te definiëren, maar ook de opera- 
ties. Hierdoor wordt de implementatie in één constructie geconcen- 
treerd en niet over verschillende definities en declaraties verspreid. 
De definitie en implementatie van het type set zouden we in deze 
notatie kunnen vastleggen als: 


definition settype; 
type set; 
procedure empty(var s: set); 
pre: true 
post: s = Ø} 
procedure insert(var s: set; i: integer); 
pre: s=va|vi<n 
post: s = y U {i}} 
procedure delete (var s: set; i: integer); 
pre: s = v 
post: s = v^ {i}} 
function min(s: set): integer; 
pre: s= Vy 
post: s = v A min(s) = minimun(v)} 
function isempty(s: set): boolean; 
pre: s= v 
post: s = v A (isempty(s) ® v = Ø)} 
end; 
implementation settype; 
type set = record e: array[0..n] of integer; 
as O..n 
end; 
{Abstractiefunctie: voor s van het type set geldt: 
Als) = {s.elj} | Os j < s.a} 
Representatie-invariant 
R: (Ai: i € Z: (Nk:0<k < s.a: s.elk} = i) < 1) AOS s.a $ n} 
rocedure search(var i: integer; var b: boolean; s: set; j: integer); 
{pre: RAA(s) = v 
post: RA AlS) = Vv AOS iss s.a 
Ab = true» (0 S i< s.a Aseli] =j) 
^A b = false » (Ak:0 <k < s.a: s.elk] # j)} 
var k: 0..n; a 
begin s.els.al := j; 
k := Of 
{inv.: k S s.a A (Ap:0 <p 
while s.e[k] <> j do k := k+ 
b := (k <> s.a); i :=k 


< k: s.elp] # j)} 
1; 


end; 
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rocedure empty(var s: set); 
{ pre: true 


post: R Aa A(s) = Ø} 
begin s.a := 0 end; 
rocedure insert(var s: set; i: integer); 
[pre: R a A(s) = va lvl < n 
post: Ra Als) = v U {i}} 
var b: boolean; 
“index: O..n; 
begin search(index,b,s,i); 
if not b 
then begin s.els.al := i; 
sa ;= s,a + 1 
end 
{R a A(s) = v U {i}} 
end; 


rocedure delete(var s: set; i: integer); 
{pre: R a A(s) = v 


post: R a A(s) = vN{i}} 


begin :.... {maakt gebruik van search} ..... end; 
function min(s: set): integer; 

pre: R A A(s) = v 

post: RA A(s) = v A min(s) = minimum(v)} 

BOWEN ee s ete +: end; 


function isempty(s: set): boolean; 
{pre: RA A(s) = v 
„post: RA A(s) = v A (isempty(s) v = 4) } 
NEER Gates ees o end 
end; sg 


De definitiemodule is te vergelijken met de heading van een proce- 
dure: de 'interface' wordt gedefinieerd. De specificatie van de ope- 
raties (pre- en postcondities van de procedures en functies) wordt 
gegeven in termen van het gedefinieerde type (hier: verzamelingen 
van integers). Als het bovenstaande in een programma wordt opge- 
nomen, mogen de in de definitie voorkomende namen in het pro- 
gramma gebruikt worden. 

De implementatiemodule is te vergelijken met de body van een 
procedure: deze zou veranderd kunnen worden zonder dat dit voor 
de rest van het programma consequenties heeft. De namen, zoals 
search, die in de implementatie geintroduceerd worden, zijn lokaal 
voor de implementatiemodule. 

In de precondities wordt onderscheid gemaakt tussen 'true' en 
Is = v', De preconditie 's = v' geeft impliciet aan dat s een waarde 
moet hebben. De preconditie 'true' geeft aan dat het gaat om een 
initialisatie, dat wil zeggen de toekenning van een initiële waarde. 

Voor de gekozen implementatie is de bijbehorende abstractie- 
functie en representatie-invariant vermeld. De specificatie van het 
effect van de procedures en functies zal gegeven moeten worden in 
termen van de representatie (hier: een array e en een extra integer 
a). Zo'n specificatie wordt bepaald door de specificatie uit de defi- 
nitie te combineren met de abstractiefunctie en de representatie- 
invariant. Hierdoor ontstaan dus een pre- en een postconditie (per 
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procedure /functie) die het effect beschrijven voor de representatie; 
met deze pre- en postconditie is dan de body te construeren, 
Hierboven staat bijvoorbeeld in de implementatiemodule: 


procedure empty(var s: set); 
{pre: true 
post: RA A(s) = Ø} 


hetgeen equivalent is met 


procedure empty(var s: set); 
{pre: true 
post: RA {s.eljl | OS j < s.a} mp} 


en het is duidelijk dat dit effect gerealiseerd wordt door de body 


begin s.a := 0 end 


Als de bovenstaande definitie en implementatie in een programma 
zijn opgenomen, zouden we kunnen declareren: 


var X;Ø: Set 


Daarna kunnen we met deze variabelen manipuleren via de operaties 
die in de definitie zijn gegeven. 


Men noemt de definitie en implementatie samen wel de declaratie van 
een abstract datatype. Samenvattend kunnen we hiervan stellen: 


notatie 
de waardenverzameling en de operaties van het type worden 
gedefinieerd 


information hiding 
de gebruiker van de data-abstractie behoeft niet te weten 
hoe de waarden intern gerepresenteerd worden 
beveiliging 
de gebruiker van de data-abstractie kan met de waarden 
alleen manipuleren via de gedefinieerde operaties en kan 
niet direct werken met de representaties 


Laten we nog een voorbeeld bekijken. 
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program h; 
type aantal 0, .maxint; 
lengte 150; #00 
definition histogrammen; 
type histogram; 
procedure initialiseer(var h: histogram); 
{pre: true 
post: h = hist A hist is 'leeg'} 
procedure voegtoe(var h: histogram; x: lengte); 
{pre: h = hist 
post: h = hist waarin x verwerkt} 
function frequentie(h: histogram; x: lengte): real; 
{pre: h = hist | 
post: h = hist A (frequentie(h,x) = (aantal keren dat x 
voorkomt in hist)/ (totaal aantal waarden in hist) } 


end; 
implementation histogrammen; 
type histogram = record a: arrayllengte] of aantal; 
totaal: aantal 
end; 
{Abstractiefunctie: voor h van het type histogram geldt: 
A(h) = (Ai: 150 < i < 200: h.a[i] = aantal malen dat i 
voorkomt) 
Representatie-invariant: 
Rr h.totaal = (Si: 150 S i < 200: h.alil)} 
procedure initialiseer(var h: histogram); 
var k: lengte; prea 
begin for k := 150 to 200 do h.alk] := 0} 
Hitotaal = 0 LAG, 
end; 
procedure voegtoe(var h: histogram; x: lengte); 
begin h.alx] := h.alx]+1; 
h.totaal := h.totaal + 1 


end; 
function frequentie(h: histogram; x: lengte): real; 
begin frequentie := h.alxl/h.totaal end; 
end; 
var mlen,vlen: histogram; 
function vergelijk(h1,h2: histogram; x: lengte): boolean; 
begin vergelijk := (frequentie(h1,x) <= frequentie(h2,x)) end; 
begin initialiseer(mlen); initialiseer(vlen); | 
s. osot VOOGtDE(MmIeN, 1803) see ; voegtoe(vlen, 175); <s. 
.…. if vergelijk(mlen,vlen,169) then ......... 


. es se . ss es ee es se se see ee 


Met de ingevoerde notatie kunnen we ook nieuwe structuren definië- 
ren. Een structuur is een mogelijkheid om nieuwe samengestelde 
typen te definiëren waarbij de samenhang van de componenten 
dezelfde is voor al deze typen. De componenten worden ook op 
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dezelfde manier voor alle typen (met dezelfde structuur) geselec- 
teerd. In Pascal komen een aantal standaardstructuren voor zoals 
het array en het record. Deze structuren gebruiken we om typen te 
definiëren. Dit gebeurt door de structuur te voorzien van parame- 
ters, meestal zijn dat op zich weer typen, in een typedefinitie. Zo 
kunnen we met de arraystructuur een nieuw type definiëren door in 
een typedefinitie de arraystructuur te voorzien van twee typepara- 
meters: het indextype en het componenttype. We introduceren nu de 
mogelijkheid om nieuwe structuren te definiëren die dan later 
gebruikt kunnen worden om nieuwe typen te definiëren. 

Laten we terug gaan naar het type set. De definitie legde een 
verzameling van integers vast als type. We definiëren nu: 


definition setstructure; 
structure set(type t); 
procedure empty(var s: set(t)); 
procedure insert(var s: set(t); i: t); 
procedure delete(var s: sett) Tet)? 
function min(s: set(t)): t}; 
function isempty(s: set(t)): boolean 
end; 
implementation setstructure; 
structure set(type t) = record e: array[0..n] of t; 
äi Qix 


end; 
procedure search(var i: integer; var b: boolean; 
B: 50E (tjy Jr t)? 


begin jö.. ipi end; 
procedure empty(var s: set(t)); 
Degil sasi reta end; 


We hebben pre- en postcondities en de verdere uitwerking hier weg- 
gelaten omdat deze geheel analoog zijn aan de definitie en implemen- 
tatie die we eerder gaven voor het set-type. 

We spreken nu van de definitie van een abstracte datastructuur. 
Als het bovenstaande in een programma is opgenomen zouden we in 
dit programma kunnen definiëren: 


type intset = set(integer); 
deelset = sèt(1:.10),; 


En we kunnen declareren: 
var i,j: intset; 


k: deelset; 
r: set(real); 
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Hierbij kunnen wél aan het actuele type van een structuur (hierbo- 
ven: integer, 1..10 en real) eisen gesteld worden in verband met 
de gebruikte operaties in de procedures en de functies in de imple- 
mentatie. In de functie min komt bijvoorbeeld het vergelijken van 
twee waarden voor van het basistype t. We kunnen als actueel type 
voor t dan alleen een type gebruiken waarvoor het ‘kleiner dan! 
teken gedefinieerd is. Dit soort restricties nemen we als een soort 
preconditie op bij de definitie. 


Voor abstracte datastructuren/typen geldt dat de operaties 
assignment(x := y) en de test op gelijkheid (if x = y then ...) niet 
als vanzelf gedefinieerd zijn. Indien ze gewenst zijn zullen ze als 
operaties in de definitiemodule gedefinieerd en in de implementatie- 
module geïmplementeerd moeten worden! 


6.3 SIMULATIE IN PASCAL 


In 6.2 hebben we een notatie geïntroduceerd die niet in Pascal 
voorkomt. We kunnen echter het met deze notatie geïntroduceerde 
abstracte datatype (niet de abstracte datastructuur) simuleren in 
Pascal. We zullen dat voor het type set doen. Daartoe definiëren we: 


type operaties = (empty, insert,delete,min, isempty); 
simset = record e: arraylt..nl of integer; 
a: Osin "a 
end 


De operaties van de typedefinitie voor set worden nu gerealiseerd 
in een procedure intsimset: 


procedure intsimset(var s: simset; var w: integer; 
var r: boolean; o: operaties); 


waarin de functies en procedures van de typedefinitie van set 
lokale functies en procedures worden. Zo zal de insert gerealiseerd 
worden door een lokale procedure 


procedure insertproc(i: integer); 


We krijgen dan: 


procedure intsimset(var s: simset; var w: integer; var r: boolean; 
o: operaties); geen 
procedure emptyproc; 
begin s.a := 0 end; 
procedure insertproc(i: integer); 
var j: integer; 
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begin j := 1; 
while (F < s.a) and (i<>s.eljl) do j z= j+1# 
if sceldl x> 1 
“then begin s.a := sS.a+tl; 
s.els.al := i 


end 
end; 
procedure deleteproc(i: integer); 
var j: integer; 
begin j := 1; 
while (j < s.a) and (i <> s.eljl) do j := j+1; 
if selje 
T then begin selj] := s.els.al; s.a := s.a-1l end 


end; 
function minproc: integer; 
var i‚m: integer; | 
begin m :«= maxint; 1 := 1; 
while i <= s.a do 
begin if s.elil < m then m := s.elil; 


i sa iti 
end; 
minproc := m 
end; 
function isemptyproc: boolean; 
=~ begin isemptyproc := (s.a = 0) end; 


begin {nu de body van intsimset} 
case o of 
empty « emptyproc; 
insert : insertproc(w); 
delete : deleteproc({w); 
min : W := minproc; 
isempty: r := isemptyproc 


end; 


We hebben nu de procedure search, die we eerder introduceerden 
ter illustratie, weer weggelaten. In de procedures en functies heb- 
ben we de pre- en postcondities weggelaten; deze zijn, afgezien 
voor de procedure delete, dezelfde als ze steeds geweest zijn. Voor 
de procedure delete hebben we nu aangenomen dat deze alleen 
wordt gebruikt voor niet-lege verzamelingen . 

Als de typen operaties en simset en de procedure intsimset op de 
bovenstaande wijze gedefinieerd zijn, wordt het programma waarmee 
we in 6.1 gestart zijn: 

(met 


var h1: integer; 


h2: boolean; 


hulpvariabelen die in voorkomende gevallen als 'dummy' parameter 
worden gebruikt) 
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intsimset(x,hl,h2,empty) ; 


Vars 
while v<=n do 
begin intsimset(x,w,h2,insert); v := v+1 end; 


intsimset(p,hl,h2,empty); 

intsimset(x,‚hl,r, isempty); 

while not r do 

begin intsimset(x,k,h2,min); 
intsimset(p,k,h2, insert); 
V := k} 
while v<=n do 

begin intsimset(x,v,h2,delete); 
Vv := v+k 


end; 
intsimset(x,h1,r, isempty) 
end; 

intsimset(p,hl,r, isempty); 

while not r do 

begin intsimset(p,k,h2,min); 
intsimset(p,k,h2,delete); 
write(k); 
intsimset(p‚,hl,r, isempty) 


end 


We hebben de simulatie consequent toegepast. We hadden nu de 
functie isempty echter weg kunnen laten en direct in de repetities 
als boolean expressie x.a <> 0 en p.a <> 0 kunnen gebruiken. 


6.4 SPECIFICATIE VAN TYPEN EN STRUCTUREN 


In 6.2 is de structuur set gedefinieerd. We wisten daarbij precies 
wat de waardenverzameling en de operaties moesten zijn, omdat we 
het begrip verzameling kennen vanuit de wiskunde. Stel dat we 
echter een andere structuur of een ander type willen implementeren. 
We zullen dan een specificatie van deze structuur of van dit type 
moeten hebben om na te kunnen gaan of onze implementatie correct 
is, We zullen hier een notatie invoeren voor dit soort specificaties. 
We kunnen twee soorten specificaties onderscheiden: 


- expliciete specificaties (abstracte implementaties, abstract model 
specifications) 
kies een representatie met behulp van bekende typen of in 
wiskundige terminologie; operaties vastleggen met pre- en 
postcondities 
(is in het voorgaande bij set toegepast) ; 


162 Voortgezet programmeren 


- impliciete specificaties (axiomatische specificaties) 
beschrijf de gewenste eigenschappen van de waardenverzame- 
ling en de operaties daarop met behulp van zogenaamde axio- 
ma's 


De tweede soort specificatie hebben we dus nog niet gezien. Om 
deze te introduceren zullen we voorbeelden bekijken.. 


Als eerste voorbeeld kijken we naar de specificatie van de natuur- 
lijke getallen met als operaties: 'maak het getal 0', 'is het getal 0?!, 
'de opvolger van een getal', 'het optellen van twee getallen! en 'de 
test op gelijkheid van twee getallen', We geven eerst de specificatie- 
module en zullen die daarna uitleggen. 


specification natural; 

type NatNo; 

sorts NatNo, boolean 

functions 
Zero > NatNo 
IsZero(NatNo) > boolean 
Succ (NatNo) > NatNo 
Add(NatNo,NatNo) > NatNo 
Eq(NatNo,NatNo) > boolean 

axioms for all x,y € NatNo let 
IsZero(Zero) = true 
IsZero(Succ(x)) = false 
Add(Zero,y) = y 
Add(Suce(x),y) = Succ(Add(x,y)) 
Eq(x,Zero) = IsZero(x) 
Eq(Zero,Succ(y)) = false 
Eq(Succ(x),Succ(y)) = Eq(x,y) 


end; 


De functies die op het type van toepassing zijn, worden aangegeven. 
Daarbij wordt vermeld wat het type van de argumenten is (en daar- 
mee impliciet het aantal argumenten). De waardenverzameling wordt 
niet opgegeven omdat in dit geval dit impliciet is gedaan door de 
waarde 0 in te voeren en de rest van de waarden kunnen afgeleid 
worden met behulp van de functies. In de definitie van de functies 
spelen twee typen (in de specificatie sorts genoemd omdat het ook 
over structuren kan gaan; sorts is een aanduiding voor typen en 
structuren) een rol: het te specificeren type NatNo en het (bekend 
veronderstelde) type boolean. Dit wordt aan het begin van de spe- 
cificatie vermeld. Na het opnemen van de te gebruiken typen en de 
functies volgt een vastlegging van de effecten van de functies in 
zogenaamde axioma's. De effecten worden beschreven door van 
mogelijke combinaties van functies te laten zien wat het effect is. 

Bij deze specificatie krijgen we geen enkele indicatie voor de 
mogelijke implementatie. Deze specificaties zijn vaak moeilijker te 
begrijpen dan de andere soort specificaties. 
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We zullen nog een voorbeeld bekijken. We specificeren nu de set- 
structuur met de operaties zoals we die in 6.2 gebruikt hebben. 

Om de beschrijving overzichtelijk te houden zullen we alle operaties, 
ook die we eerder als procedure definieerden, nu als functie be- 
schouwen. 


specification setstructure; 
structure set (type t); 
sorts set, t, boolean 
functions 
empty(set) > set 
insert(set,t) > set 
delete(set,t) > set 
min(set) > t 
isempty(set) > boolean 
axioms for all s € set, i,j € t let 
insert(insert(s,i),j) = if i = j then insert(s,i) 
else insert(insert(s,j),i) 
isempty(empty(s)) = true 
isempty(insert(s,i)) = false 
delete(empty(s),i) = empty(s) 
delete(insert(s,i),j) = if i = j then delete(s, j) 
else insert(delete(s,j), i) 
insert(delete(s,j),i) = f i = j then insert (s,i) 
else delete(insert(s,i),j) 


min(empty(s)) = max(t) 
min(insert(s,i)) = if min(s) < i then min(s) 
else i 


end; 


We hebben hier gedefinieerd dat het minimum van een lege verzame- 
ling gelijk is aan de maximale waarde van het basistype. In alle 
gevallen kan dit gebruikt worden. 


Moeilijkheden bij dit soort specificaties zijn: volledigheid (wordt 
alles van de datastructuur of van het type vastgelegd?), consisten- 
tie (zijn de verschillende eisen niet met elkaar in conflict?) en 
‚leesbaarheid (gegeven een specificatie, kunnen we ons een voor- 
stelling maken van hetgeen gespecificeerd is, of wordt ons inzicht 
geheel bepaald door de - suggestieve - naamgeving?). Ondanks 
deze moeilijkheden is het zaak toch zo volledig en zorgvuldig moge- 
lijk te specificeren. Enerzijds om het type/de structuur zo duidelijk 
mogelijk te beschrijven, anderzijds om bij de implementatie zoveel 
mogelijk houvast te bieden. 
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6.5 VERIFICATIE 


Hoe de specificatie ook gegeven is, we zullen moeten laten zien dat 
de gekozen implementatie correct is. In de specificatie worden opera- 
ties f1,f9,...‚fn vastgelegd en een waardenverzameling T. Bij de 
implementatie werken we met de waardenverzameling T' van het 
type waarin de implementatie wordt gerealiseerd. Deze waardenver- 
zameling kan beperkt worden door de representatie-invariant R. 
Daarnaast wordt in de implementatie gebruik gemaakt van de opera- 
ties f],f2,...,fn in de vorm van procedures en functies. 

Verificatie van de implementatie houdt nu in dat we moeten laten 
zien dat de operaties f', toegepast op elementen van T' (onder de 
restrictie R) resultaten opleveren uit T' waarvan de abstractiefunc- 
tie die elementen van T oplevert, die we ook krijgen als we de ope- 
raties f toepassen op de waarden die we krijgen als we de abstractie- 
functie toepassen op de argumenten van de operaties f'. 


a ceT bG T 


Alc) =a 


A(d) =b 


Ook moet de representatie-invariant bij de operaties f' gehandhaafd 
blijven. 

Anders gezegd: Als we een a €T hebben met impl(a) € T' waar- 
voor geldt A(impl(a)) =a a R(impl(a)), dan komt verificatie erop 
neer dat we voor alle f; laten zien: 


A(f;Gmpl(a))) = f;(a) met R(f;(impl(a))). 


Hier hebben we gedaan of alle operaties één argument hebben. Een 
analoge redenering geldt voor de operaties met meer dan één argu- 
ment. 

In de implementaties van 6.1 en 6.2 hebben we steeds bij de pro- 
cedures en functies de abstractiefunctie en de representatie-invari- 
ant opgenomen in de pre- en postconditie en we hebben ook de 
relatie tussen fi en f; laten zien. 
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De algemene handelwijze is als volgt: 


Bij het oplossen van een programmeerprobleem ontstaat de 
gedachte een bepaalde structuur goed te kunnen gebruiken. 
Deze structuur kan inherent aan het probleem zijn (het pro- 
bleem is gesteld in termen van die structuur), of het programma 
zal met zo'n structuur - als hulpvariabele - een oplossing 'een- 
voudig! kunnen realiseren. 

Dan moet die structuur goed gespecificeerd worden. Dat kan met 
behulp van een expliciete of een impliciete specificatie. 
Uitgaande van de specificatie wordt de definitiemodule ontwor- 
pen. Dan ligt de waardenverzameling en het effect van de ope- 
raties vast. 

Als de structuur gedefinieerd is kan het programma, dat van 

die structuur gebruik moet maken, ontworpen worden. 
Daarnaast zal een implementatiemodule ontworpen moeten worden. 
Er zal een representatie gekozen moeten worden met daarbij een 
abstractiefunctie en een representatie-invariant. Daaruit volgen 
de pre- en postcondities van de procedures en functies die de 
operaties realiseren, en die kunnen vervolgens ontworpen wor- 
den passend bij deze condities, 

Tot slot moet dit alles samengevoegd worden tot een programma. 


7 SEQUENCES 


7.1 INLEIDING 


Stel dat we het volgende probleem moeten oplossen. Gegeven is een 
invoerrij die positieve gehele getallen bevat. Gevraagd wordt deze 
getallen in een uitvoerrij te plaatsen, maar wel zodanig dat eerst de 
even getallen in de uitvoerrij komen te staan in de omgekeerde 
volgorde ten opzichte van de volgorde waarin ze in de invoerrij 
voorkomen, gevolgd door de oneven getallen in de volgorde van de 
invoerrij. De oplossing zou kunnen zijn: 


while not eof do 
begin read(a); 
if a mod 2 = 0 
~ then 'plaats-a in hulprijl' 
else 'plaats a in hulprij2' 


end; 
while 'hulprijl niet leeg' do 
begin 'selecteer laatste element van hulprijl in a'; 
write(a) 


end; 
while 'hulprij2 niet leeg' do 
begin 'selecteer eerste element van hulprij2 in a'; 
write(a) 
end 


Uit het voorbeeld blijkt al enigszins dat het handig zou zijn als we 
als datastructuur zouden beschikkén over een rijstructuur waarbij 
tot de operaties in ieder geval zouden behoren het toevoegen en 
verwijderen van elementen aan beide 'uiteinden' van de rij. Deze 
structuur is te realiseren met kettingen, maar dan wordt wellicht 
een grotere vrijheid geboden dan wenselijk is, omdat pointers het 
bijvoorbeeld mogelijk maken om ook 'middenin' wijzigingen aan te 
brengen. 

We nemen voorlopig even aan dat er zo'n rijstructuur aanwezig is 
en dat een nieuw type, waarvan de waardenverzameling bestaat uit 
rijen integers bijvoorbeeld, gedefinieerd kan worden als: 


Sequences 


type intrij = sequence( integer); 


Wat is de waardenverzameling precies? De waardenverzameling van 
een arraytype, bijvoorbeeld, is de verzameling van alle afbeeldingen 
van het indextype in het componenttype. Kunnen we de waarden- 
verzameling van een sequence-type op analoge wijze karakteriseren? 

Als A een eindige, niet-lege verzameling is, dan wordt in de wis- 
kunde met A* de verzameling aangegeven die bestaat uit alle rijen 
met eindige lengte van elementen van A, inclusief de lege rij (de rij 
bestaande uit 0 elementen van A). Als notatie voor een element van 
A* gebruiken we (a1,22,23,...,an) als voor alle i: aj€A. De lege 
rij wordt aangegeven met ( ). 

De waardenverzameling van het type T, gedefinieerd als 


type T = sequence(t); 


is Wi als W‚ de waardenverzameling van het type t is. 

Net zoals bij andere samengestelde typen kunnen we voor sequen- 
ces geen waarden expliciet benoemen. We zullen de notatie voor 
waarden van sequences, zoals bijvoorbeeld (cj,cz,c 3), alleen gebrui- 
ken in condities bij de operaties. 


7.2 OPERATIES, IMPLEMENTATIE EN ENKELE 
VOORBEELDEN 


Voor de beschrijving van de operaties voeren we, voor verzamelin- 
gen als A* (in combinatie met A), de notatie in: ~ (concatenatie). 
Als x van het type T is en c van het type t uit de typedefinitie 


type T = sequence(t); 


dan is de rij die ontstaat door c achter de rij x te plaatsen ook van 
het type T. Als notatie van deze nieuwe rij gebruiken we nu x ~ (c). 
Zo ook ontstaat de sequence (c) ~ x door c vóór de rij x te plaatsen. 

Met behulp van deze notatie specificeren we de sequencestructuur 
en definiëren we als 'standaardoperaties!' voor sequences (met v een 
variabele van het type t, c een waarde van het type t, y een waarde 
van het type T en x een variabele van het type T): 


{true} CreateSeq(x) {x = ( )} 

{x = (c) ~ y} a := First(x) {a =caAx= (c) « y} 
{x = (c) » y} GetFirst(x,v) {v =c ax =y} 

{x = y ~ (c)} GetLast(x,v) {v =c ax= y} 
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{x = y} PutFirst(x‚c) {x-=(e) ev y} 
{x = y} PutLast(x‚c) {x = y ~ (c)} 
{x = X} SeqIsMT(x) (Seq1eMT (x) edy s LY 


4 


De operaties First, GetFirst en GetLast zijn uiteraard niet gedefini- 
eerd voor lege sequences, de operaties PutFirst en PutLast wel. 


Met twee sequences hulprij1 en hulprij2, beide van het type intri pE 
kunnen we het algoritme uit 7.1 nu formuleren als: 


CreateSeq(hulprij1); AARLE 2000 
while not eof do 
begin in read(a); 
if a mod 2 = 0 then PutLast(hulprijl,a) 
else PutLast(hulprij2,a) 


end; 
while not SeqIsMT(hulprijlt) do 


begin GetLast(hulprijl,a); 
write(a) 


end; 
while not SeqIsMT(hulprij2) do 
begin GetFirst(hulprij2,a); 
write(a) 
end 


Sequencetypen zijn zogenaamde dynamische typen: het aantal ele- 
menten van een waarde is wisselend en het maximale aantal is op 
voorhand niet bekend. Voor de implementatie van sequences komen 
dan kettingen en andere vormen van lijsten (zie hoofdstuk 8) als 
eerste in aanmerking. We kijken naar de implementatie met behulp 
van kettingen. De kettingen zijn dubbel gelinkt vanwege het toe- 
voegen en weglaten van waarden aan beide 'uiteinden'. We werken 
met kettingen van de vorm: 


: volg 
: voorg 


: W 


Nu we de implementatie gekozen hebben kunnen we de abstractie- 
functie en representatie-invariant formuleren. 

De abstractiefunctie is (met a en b pointers naar het 'eerste' 
respectievelijk het 'laatste' element van de lijst die de sequence seg 
representeert): 


Sequences 


A(a,nil) G} 
A(nil,b) BI. 
A(a,b) = (at.w) ~ A(at.volg,b) {= A(a,bt.voorg) ~ (bt.w)} 


Als representatie-invariant moet gelden: 


a = nil ® b = nil 
A (de onderlinge volgorde van de waarden in de lineaire 
lijst wordt door de operaties niet veranderd) 


De sequencestructuur wordt dan als volgt beschreven: 


definition sequencestructure; 
structure sequence(type t); 
function First(s: sequence(t)): t; 
procedure CreateSeg(var s: sequence(t)); 
procedure GetFirst(var s: sequence(t); var v: t); 
procedure GetLast (var s: sequence(t); var v: t); 
procedure PutFirst(var s: sequence(t); v: t); 
procedure PutLast (var s: sequence(t); v: t); 
function SeqIsMT(s: sequence(t)): boolean 

end; 

implementation sequencestructure; 
type segel = record volg,voorg: Asegel; w: t end; 
structure sequence(type t) = record a,b: Asegel end; 
function First(s: sequence(t)): t; Rek: 

pre: Als) = (c) ~x 


post: First(s) = c} 
begin First := s.at.w end; 


procedure CreateSegq(var s: sequence(t)); 
pre: true 


posts Als) = (…)} 
begin S.a := nil; s.b := nil end; 
procedure GetFirst(var s: sequence(t); var Ve t)? 
pre: Als) = (c) ~x ide 


post: ve c A A(8) = x} 
var p: tsegel; 


begin p := Sia; v := pt.w; s.a s= s.at.volg; 
if s.a = nil then s.b := nil else s.at.voorg := nil; 
dispose (p) 

end; 


procedure GetLast(var s: sequence(t); var v: t); 


{pre: Als) = x ~ (c) 


post: v= c A-Als) =x} 
var p: Îsegel 
begin Pp := 8b; V s:= pf.w; s.b :3 s.bt.voorg; 
if s.b = nil then S.a := nil else s.bt.volg := nil; 
dispose (p) 


end; 
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procedure PutFirst(var s: sequence(t); v: t); 
{pre: Als) =x 
post: Als) = (y) œx} 
var p: tseqel; 
begin new(p); pt.w := v; pħt.voorg := nil; pt.volg := s.a}; 
if s.a = nil then S.b := p else s.at.voorg := pi 
S.a := p 
end; 
procedure PutLast(var s: sequence(t); v: t); 
pre: A(s) = X 
post: Als) = x ~ (v)} 
var p: tsegel; 
begin new(p); pî.w := v; pt.volg := nil; pt.voorg := s.b; 
if s.b = nil then S.a := þ else s.bt.volg := p; 
E 2D 
end 
function SeqIsMT(s: sequence(t)): boolean; 
{pre: Als) = X 
post: SeqIsMT(s) = (X= ( ))} 
begin SeqIsMT := (s.a = nil) {and (s.b = nil)} end 
end; 


De pre- en postcondities van de operaties in de definitiemodule zijn 
hier niet vermeld; ze zijn analoog aan de specificatie van de operaties 
op blz. 167 en 168. In de implementatiemodule moet eigenlijk aan elke 
conditie toegevoegd worden dat de representatie-invariant R geldt. 


Opmerkingen 


Bij het implementeren van abstracte datastructuren /typen ontstaat 
een aantal gevaren. 


a. De assignment is voor abstracte datastructuren/typen niet als 
vanzelf gedefinieerd. Stel dat we een operatie 's1 := 52! willen 
gebruiken, Aan de definitiemodule voegen we toe: 


function copy(s: sequence(t)): sequence(t); 
pre: s = 8 
post: s = SA copyl{s) =S} 


en aan de implementatiemodule moet de funetie copy toegevoegd 
worden. Omdat voor pointers de assignment wél gedefinieerd is, 
kan de verleiding ontstaan om de body te schrijven als: 


begin copy := s end 


Dit is echter fout! Na aanroep, bijvoorbeeld s1 := copy(s2), heb- 
ben weliswaar sl en s2 dezelfde waarde, maar elke wijziging in de 
waarde van sl heeft ook een wijziging van de waarde van s2 tot 
gevolg (aliasing). 


Sequences 171 


Kortom, de implementatie van copy zal de gehele lineaire lijst 
moeten kopiëren! 


b. Stel dat we in de definitiemodule toevoegen 


procedure MakeMT(var s: sequence(t)); 
pre: s = X (d.w.z. s heeft een waarde) 


post: s= ( )} 


De implementatie van MakeMT kan dan niet volstaan met (zoals in 
CreateSeg): 


procedure MakeMT(var s: sequence(t)); 
begin S.a := nil; s.b := nil end; 


want dan zijn de oorspronkelijke elementen van de lineaire lijst 
niet meer accesseerbaar. Indien het computersysteem garbage 
collection realiseert, hoeft dit weliswaar geen echt probleem te 
zijn, maar het is beter in alle gevallen de lijst netjes met behulp 
van dispose-statements af te breken. 


c. Het value-parameter mechanisme zorgt ervoor dat bij een aanroep 
van 


procedure P(s: sequence(t); ....)?; 


de waarde van de (implementatie) pointer s na afloop gelijk is 
aan de waarde bij aanroep. Als echter, in de body, de waarde 
van de lineaire lijst verandert, bijvoorbeeld door dispose- 
statements, zal na aanroep de waarde van de sequence ook ver- 
anderd zijn (hetgeen niet de bedoeling was getuige het ontbreken 
van var). Bij de implementatie zal dit ongewenste effect dus 

zorg vuldig vermeden moeten worden, bijvoorbeeld door te werken 
met een kopie van de lineaire lijst (een kopie van de (implemen- 
tatie) pointer s is niet voldoende!; zie opmerking a). Let wel: 
deze kopie zal aan het einde van de procedure body weer netjes 
afgebroken moeten worden in verband met garbage collection 
(zie opmerking b). 


Voorbeeld 1 


Een invoerrij bestaat uit gehele waarden. We kunnen de invoerrij 
weergeven als 


(Vo Wo Y1 W1 V2 Wo> En Vn Wp? 
Er geldt: 


E > n j id . d e. o oè » 
i j+] SP W$ Wi] en v; $ w; voor i = 0,1,2, 
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Gevraagd wordt de waarden uit de invoerrij in niet-dalende volgorde 
in de uitvoerrij te plaatsen. 

Stel dat alle waarden uit de invoerrij tot en met de waarde wj-1 
zijn gelezen. Van deze waarden mogen alleen die in de uit voerrij 
staan die niet groter zijn dan vj en niet groter zijn dan wj. Stel 


m = MLV. p i 


dan geldt m < vj a m < wj. De waarden die gelezen zijn kunnen nu 
in twee groepen verdeeld worden: 


- De waarden die ten hoogste m zijn. Deze getallen kunnen al in de 
uitvoerrij geplaatst zijn; 

- De waarden die groter zijn dan m. Deze waarden kunnen nog niet 
in de uitvoerrij geplaatst zijn. Ze worden 'bewaard' in een hulp- 
variabele h, een sequence. 


Zo krijgen we als invariant voor het algoritme: 


invoerrij = (vj, ‚Wis Vaar Wide) Am = min(v;_j,Wi_j) A 


(de uit voerrij bevit in niet-dalende volgorde al die waarden 
van Vp WgpYrpWi VN die ten hoogste m zijn) A 


(de sequence h bevat in niet-dalende volgorde al die waarden 
van Vo Wp pW» iYi die groter dan m zijn) 


Als de invoerrij leeg is, is de eindrelatie nog niet bereikt: eventuele 
waarden uit h moeten nog aan de uitvoerrij toegevoegd worden. Het 
algoritme wordt: 


CreateSeq(h); 
while not eof do 
begin in read(v); read(w); 


if v < w 

~ then begin x := v; y := w end 
else begin x := wW; y := v end; 

{x = min(v,w) A y = max(v,w)} 

PutLast(h‚y); 


while First(h) <= x do 
begin GetFirst(h‚p); write(p) end; 
write(x) 


end; 
while ı not SeqIsMT(h) do 
begin in GetFirst(h,p); write(p) end 


De sequence wordt in dit voorbeeld gebruikt als een soort opslag- 
ruimte, We kunnen hiervoor bijvoorbeeld geen array gebruiken 
omdat van tevoren niet bekend is hoeveel v- en w-waarden 
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onthouden moeten worden. Dit gebruik van sequences in algoritmen 


komt vaak voor. 


Voorbeeld 2 


Een zaagtandvormig elektrisch signaal 


- s(t) = 0 voor t 


- s(t) 


Als een aantal van deze signalen gegeven is: sj(t),sg(t),ss(t),.… 
= dan kan het somsignaal somsig(t) gedefinieerd worden als: 


somsig(t) = s(t) + S(t) + S(t) Fsb 


a 


to 


max(0,-t+t +a) voor t 


ENEE 


wordt gedefinieerd door: 


< 


2 


to 
to 


Ea -> 0. 


“jp 


Stel dat een aantal signalen gegeven is in de invoerfile als van het 


type | 


type zaagtand = record t0,a: real end; 


dan kunnen we de waarde van de invoer weergeven als: 


((t0,„a,) ‚(t0, ag) ’ (t0333) e 


sa) 


De invoer is gesorteerd op niet-dalende volgorde van de eerste com- 


<O s 


ponent van de records: t0, S t0, $ 


tOr Saya 


3 


Gevraagd wordt de maximale waarde te bepalen van het somsignaal 


van de in de invoer gegeven signalen. De eindrelatie zouden we 


kunnen formuleren als: 


'alle signalen uit invoer zijn 'gelezen'en zodanig verwerkt dat 
max gelijk is aan de maximale waarde van het somsignaal beho- 


rende bij de signalen uit invoer' 
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Als invariant kunnen we dan nemen: 


P: 'de eerste k signalen uit invoer zijn gelezen, max is gelijk aan de 
maximale waarde van het somsignaal van deze k signalen en van 
de signalen is relevante informatie vastgelegd voor de bepaling 
van volgende somsignalen'! 


We vatten dit geheel samen door te zeggen dat k signalen zijn ver- 
werkt. 
De variante relatie wordt bij de gekozen P: 


Q: k £ 'het aantal signalen in invoer! 


Omdat het aantal signalen in invoer niet bekend is nemen we als 
variante relatie de volgende Q' in plaats van Q: 


Q': ‘invoer is niet leeg! 
De eerste opzet van het algoritme wordt dan: 


‘initialisatie, zodanig dat P geldt'; 
while not eof do 
begin read(s); 
‘verwerk s' 
end 


Het maximum van het (totale) somsignaal kan alleen optreden op één 
van de tijdstippen: t01,t02,t03,... . Het somsignaal behoeft dus 
alleen op deze tijdstippen bepaald te worden. Verwerking van s 
komt dan neer op het bepalen van het somsignaal op het tijdstip 
s.t0 (we zullen dit tijdstip nu even ts noemen). Aan dit somsignaal 
op het tijdstip ts kan alleen een bijdrage geleverd worden door sig- 
nalen waarvan de t0 niet groter is dan ts. Dit zijn de signalen die 
aan s voorafgaan (door de sortering in invoer). Verwerking van s 
wordt dus: 


‘som := Sy(ts) + sg(ts) fas. + s,(ts) + s.a!; 
EE som > max then max := som 


Het signaal sk is het laatste aan s voorafgaande signaal. Van de 
signalen s1,53,S3,... ‚Sk leveren slechts die signalen een bijdrage 
aan de som waarvoor geldt: 


- ts +s.t0 +s.a>0 OR WS EPE e 


We zouden voor alle sj kunnen nagaan of deze ongelijkheid geldt. 
Maar als van de signalen sj,52,...,Sk-1 de signalen sij,si2,...,si 
geen bijdrage leveren aan het somsignaal op het tijdstip sk.t0, dan 
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zeker ook niet op het tijdstip ts (bij het signaal s). Daarom introdu- 
ceren we: 


var h: sequence(zaagtand); 
aant: integer; 


In h staan alle signalen die een bijdrage hebben geleverd aan het 
laatst bepaalde somsignaal; aant is het aantal elementen van h. Deze 
betekenissen van h en aant nemen we op in de invariant P. Uitwer- 
king van 


. — j 
bom := s‚(ts) + So(ts) Hed S (ts) +s.a 


wordt dan in eerste instantie: 


som := S.a}; 
‘verwerk de signalen uit h in de som en verwijder uit h die 
signalen die geen bijdrage leveren aan het somsignaal op 
het tijdstip ts; pas aant aan'; 

PutLast(s,h); aant := aant +1 


Voor het verwerken van de signalen wordt steeds een signaal uit h 
gehaald, (eventueel) in som verwerkt en al dan niet teruggeplaatst 
in h. Het aantal oorspronkelijk in h aanwezige signalen is aant. Het 
aantal uit h gehaalde signalen, die in som verwerkt worden en even- 
tueel teruggeplaatst worden, noemen we m. Het aantal signalen dat 
tijdens deze repetitie steeds in h staat, noemen we ah. Het totale 
algoritme wordt nu: 


max := 0; CreateSeq(h); aant := 0; 
while not eof do 
begin read(s); 
som := S.a; 
m := 0; ah := aant; 
while m <> aant do 
begin GetFirst(h,x); m := m+1; 
if x.t0 + x.a > s.t0 


then begin som := somtx.a+x.t0=-s.t0; 
PutLast(h‚x) 
end 
else ah := ah-1 
end; 
if som > max then max := som; 
aant := ah; 
PutLast(h,‚,s); aant := aant +1 


end; 
write(max ) 
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7.3 ANDERE RIJTYPEN 


Er is een groot aantal datastructuren waarvoor geldt dat de waarden- 
verzamelingen van de bijbehorende typen bestaan uit rijen van wille- 
keurige lengte (ten minste 0) van elementen van de een of andere 
waardenverzameling (van een of ander basistype). Deze structuren 
worden van elkaar onderscheiden op grond van de mogelijke opera- 
ties. 

Allereerst is er een aantal structuren die afgeleid kunnen worden 
uit de sequencestructuur door een beperking aan te brengen in de 
mogelijke operaties. Tot deze categorie behoren de stack en de 
queue die in 7,4 uitvoerig aan de orde zullen komen. 

Tot deze categorie kunnen ook de sequentiële invoerfile en de 
sequentiële uitvoerfile gerekend worden. Een operatie als read(x, v) 
komt overeen met GetFirst(x,v) en write(x,v) komt overeen met 
PutLast (x,v). | | 

Bij sequentiële filestructuren wordt een sequence x veronder- 
steld op elk moment de concatenatie te zijn van twee deelsequences: 
x =x ~ x*; x staat voor het reeds verwerkte deel, x* voor het 
nog te verwerken deel. 

In Pascal bestaat ook de filestructuur waarmee nieuwe typen 
gedefinieerd kunnen worden: 


file of basistype 


Op deze typen zijn als operaties gedefinieerd: 


rewrite(x) in de eerder gegeven CreateSeg(x) 
write(x,c) terminologie: PutLast(x,c) 

reset (x) HT heem T E S ek! 
read(x,v) GetFirst(x,v) 

eof (x) SeqIsMT(x) 


Er mag geen write-opdracht uitgevoerd worden na een read-opdracht, 
tenzij eerst een rewrite-opdracht is uitgevoerd. Er mag geen read- 
opdracht na een write-opdracht uitgevoerd worden, tenzij eerst een 
reset is uitgevoerd. 

In Pascal is standaard gedefinieerd het type 


type text = file of char; 


waarvan twee variabelen, input en output, als vanzelf gedeclareerd 
zijn. Op input zijn alleen de invoer-statements toegestaan, op out- 
put alleen de uitvoer-statements. De operaties reset en rewrite 
vinden automatisch plaats, evenals een conversie van waarden van/ 
naar karakterrijen. 
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N.B.: In Pascal wordt bij het manipuleren met files (op de achter- 
grond) gewerkt met een zogenaamde buffer, een variabele 
(die niet gedeclareerd behoeft te worden) van het basistype 
van het filetype. De variabele bij file x heeft de naam x+. 
De operaties read(x,v) en write(x,c) zijn een soort 'afkor- 
tingen' voor 


vem Ke getix) 
respectievelijk 
xt 74.07 put(x) 


waarin put en get gedefinieerd zijn als: 


(EIA Em) z} get(x) {x =y~ (w) A KEN 
xt æ Pirst (xt) } 
ix == y A x = (w)} get(x) {x = y ~ (w) A SeqIsMT(x) A 
xt = undefined} 


{x = y} put(x) {x = y ~ (x4)} 


De buffer krijgt ook bij reset een waarde (de bovenstaande 
effectbeschrijving van reset is dan ook niet volledig): 


— + k 
reset(x): LEE Eri ® 


Voorbeeld gebruik van files 


In dit voorbeeld wordt het gebruik van files geillustreerd. Een file 
van records moet gesorteerd worden op niet-dalende volgorde van 
het key-veld. Het aantal te sorteren records is onbekend. In tegen- 
stelling tot de in hoofdstuk 4 genoemde methoden werken we hier 
niet in-situ; we maken gebruik van hulpfiles. De gebruikte methode 
staat bekend als natural merge sort.. 

Voor een sequence (aj,a2,... ‚AkK) van key-waarden definiëren 
we het begrip run (een niet-dalende deelrij, zo lang mogelijk) : 


2,>---,ä; is een run als AE he 
< =j as 
a, SA voor £s1.ertd 

eenen 


We zullen de hele file (sequence) splitsen in runs, en vervolgens 
steeds twee runs mergen tot één, totdat nog precies één run res- 
teert; dan is de file gesorteerd. 
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We gebruiken: 


type elt = record key: integer; 
: po AF REEE AS 
end; 
var G,H1,H2: file of elt; 


G heeft een waarde en is de te sorteren file. 

We gaan G splitsen in runs die we over H1 en H2 verdelen, en 
vervolgens steeds een run uit H1 en een uit H2 mengen tot een 
nieuwe run die we in G plaatsen. Dit proces herhalen we totdat G 
uit precies één run bestaat. Het aantal runs in G na elke slag hou- 
den we bij in 


var aantruns: integer; 


Het programma: 


aantruns := 0; {fictief} 
while aantruns <> 1 do 
begin reset(G); rewrite(Hl); rewrite(H2); 
verdeelinruns(G,Hl1,H2); 
reset(HI); reset(H2); rewrite(G); 
mengruns(Hl,H2,G,aantruns) 


end 
met 
procedure verdeelinruns(var X,Y,Z: file of elt); 
{pre: X heeft een waarde 
post: Y en Z bevatten alle runs uit X; Y ten hoogste 
1 meer dan Z} 
begin while not eof (X) do 
begin copieerrun(X,Y); 
if not eof (X) then copieerrun(X,2) 
end 
end; 
en 


procedure mengruns(var X,Y,Z: file of elt; var nrruns: integer); 
pre: X en Y hebben een waarde oke 
post: Z bevat alle runs uit X en Y, waarbij zoveel mogelijk 
één run uit X en één uit Y zijn gemengd tot 1 nieuwe 
run A nrruns = (aantal runs in Z)} 


ee 
begin nrruns := 0; 
while (not eof (X)) and (not eof (Y)) do 
begin mengeenrun (X,Y,Z); 
nrruns := nrruns + 1 
end; 
while not eof(X) do 
begin copieerrun(X,Z); 
nrruns := nrruns + 1 
end; 
while not eof(Y) do 
begin copieerrun(Y,Z); 
~ nrruns := nrruns + 1 
end 


end; 


Het copiëren van een run van een file naar een andere gebeurt met 


procedure copieerrun(var VAN,NAAR: file Of elti; 
{pre: VAN heeft een waarde 
post: één run is van VAN naar NAAR gecopieerd} 
var einde: boolean; 
begin einde := false; 
while not einde do copieer (VAN, NAAR,einde) 
end; 


waarbij de procedure copieer steeds één element overbrengt en aan- 
geeft of de run ten einde is: 


procedure copieer(var V‚N: file of elt; var eor: boolean); 
{pre: V heeft een waarde 
post: één element is van V naar N gecopieerd, eor geeft 
aan of dat het laatste element van een run in V 
was} | 
var h: elt; 
begin read(v,h); 
write(N,h); 
if eof(V) then eor := true 
as else eor := h.key > Vt.key 


end; 


Tot slot de procedure mengeenrun, die van elk van twee files een 
run neemt, deze twee mengt tot één run, en deze plaatst in een 
derde file: 
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procedure mengeenrun(var V1,V2,N: file of elt); 
{pre: V1, V2 hebben een waarde | 
post: de eerste run uit V1 en de eerste run uit V2 zijn 
gemengd tot één run die in N is geplaatst} 
var einde: boolean; 
begin einde := false; 
while not einde do 
begin if Vlt.key < V2f.key 
then begin copieer(V1,N,einde); 
if einde then copieerrun(V2,N) 
po 
else begin copieer(V2,N,einde); 
if einde then copieerrun(V1,N) 
P OER 


end; 


Een andere bekende rijstructuur is de string. In Pascal komt ook 
het begrip string voor. Daar is het de waarde van een speciaal 
soort array: een packed array van karakters. In veel talen komt de 
string voor als zelfstandig type (of structuur). De talen verschillen 
nogal in de operaties die op strings zijn gedefinieerd. We specifice- 
ren hier een algemene vorm van strings: 


specification stringstructure; 

structure string(type t); 

sorts string, t, boolean, integer 

functions 
Null > string 
IsNull(string) > boolean 
Len(string) > integer 
Concat(string,string) > string 
SubStr(string,integer, integer) > string 
AddElem(string,t) > string 

axioms for all s‚pEstring; CEt, i,j E integer let 
IsNull(Null) = true 
IsNull(AddElem(s,c)) = false 
Len(Null) = 0 
Len(AddElem(s,c)) = 1 + Len(s) 
Concat(s,‚Null) = s 
Concat(s,AddElem(p,c)) =AddElem(Concat(s,p);c) 
SubStr(Null,i,j) = Null 
SubStr(AddElem(s,c),i,j) = 

NE df (j = 0) or (i+ j=-2) > Len(s) 
then Null 
ese iF (EPT dm Len(s) 
then AddElem(SubStr(s,i,j-1),c) 
else SubStr(s,i,j) 


end; 
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We zien hier enkele vertrouwde operaties van de sequence terug en 
de string is (dus) te implementeren met behulp van sequences. We 
kunnen de string ook direct implementeren met behulp van kettingen. 
We hebben hierboven de string als structuur gedefinieerd. Eigenlijk 
in alle gevallen is het basistype van de string het type char en we 
zouden dus ook de string als type hebben kunnen specificeren. We 
hebben hier de string gespecificeerd met enkele operaties. Andere 
operaties zijn mogelijk. In een taal als SNOBOL zijn zeer veel opera- 
ties gedefinieerd op strings. 


De naamgeving van typen die gebaseerd zijn op de sequenecestruc- 
tuur is in de literatuur nogal verwarrend: dezelfde namen worden 
gebruikt voor verschillende typen (verschillend in de zin dat er 
andere operaties zijn gedefinieerd) en bepaalde typen staan bekend 
onder verschillende namen. 


74 STACKS EN QUEUES 


We kunnen uitgaan van de volgende abstract-model-specificatie 
voor de stackstructuur, waarbij we veronderstellen dat de sequence- 
structuur bekend is: 


specification stackstructure; 
structure stack(type item) 


functions 
{trüe} CreateS(s) {s = ( )} 
{s +x} Push(s,i) (5 =: (i) = x} 
ts s (1) ~x Poplsjv) {de x Av =i} 
{s i) ex} Top(s) (a8 {i) ~ N Topls) s i} 
{s = x} StackIsMT(s) {StackIsMT(s) = (x= ( ))} 


end; 


En voor de queuestructuur: 


specification queuestructure; 
structure queue(type item) 
functions 


{true} CreateQ(qg) {q = ( )} 

{a = x} PutQ(g,i) {qa = x~ (i)} 

{q = (i) ~x} Gètolg, v) {a = x A ve= i} 

{s =x} OIsMT(q) {QIsSMT(qg) = (x = ( ))} 

{a = (i) ~ x} FirstQ(g) {q = (i) » x A 
First@(q) = i} 


end; 
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Een stack en een queue krijgen we uit een sequence door ons beper- 
kingen op te leggen aan de operaties. We zullen nu eerst naar defini- 
tie en implementaties van de stack en het gebruik ervan kijken; 

later komt dan de queue aan de orde. 


STACKS 


Allereerst de definitie, waarbij we de semantiek uitdrukken in ter- 
men van sequences. 


definition stackstructure; 


end; 


structure stack(type item); 
procedure CreateS(var s: stack(item)); 
{pre: true 
post: s=( )} 
procedure Push(var s: stack( item); is item); 
pre: s = X 
post: se (1) ~ x} 
procedure Pop(var s: stack(item); var is item); 
{pre: s = (c) ~x 
post: 8 xA i *ọ} 
function Top(s: stack(item)): item; 
{pre: s = (c) ~ x 
post: s = (c) Ax A Top(s) = c} 
function StackIsMT(s: stack(item)): boolean; 
ipre: s = X 
post: StackIsMT(s) = (x = ( ))} 


Natuurlijk kunnen we de stack implementeren met behulp van de 
sequence. Omdat dit rechtstreeks gaat zullen de abstractiefunctie 
en de representatie-invariant triviaal zijn: A(s) = s. 


implementation stackstructure; 


end; 


structure stack(type item) = sequence( item); 

procedure CreateS(var s: stack(item)); 
begin Createseg(s) end; 

procedure Push(var s: stack(item); i: item); 
begin PutFirst(s,i) end; 

procedure Pop (var s: stack(item); var i: item); 
begin GetFirst(s,i) end; 

function Top(s: stack(item)): item; 
begin Top := First(s) end; 

function StackIsMT(s: stack(item)): boolean; 
begin StackIsMT := SeqIsMT(s) end 
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We kunnen stacks natuurlijk ook direct implementeren met behulp 
van bijvoorbeeld kettingen. De sequence werd geimplementeerd 

door een dubbel geketende ketting. Dit was nodig, omdat aan beide 
'uiteinden' elementen moeten kunnen worden toegevoegd en verwij- 
derd. Bij stacks vinden de operaties plaats aan één uiteinde. Daarom 
kan bij de stack volstaan worden met een enkel geketende ketting, 
waardoor de implementatie efficiënter zal zijn. 


: next 


Pop 
Push S 


De abstractiefunctie wordt in dit geval: 


Anil) =( ) 
A(s) = (s. info,st.nextt.info,...,xt.info) 


met xt. next = nil; de representatie-invariant is wederom triviaal. 


implementation stackstructure; 
structure stack(type item) = tstackel; 
type stackel = record info: item; next: Astackel end? 
procedure CreateS(var s: stack(item)); poer 
begin s := nil end; 
procedure Push (var s: stack(item); i: item); 
var p: îstackel; 
begin new(p); pt.info:= i; pt.next := 5; S:=p end; 
procedure Pop(var s: stack(item); var i: item); 
var p: tstackel; 
begin p:= s; S:=pt.next; i:=pt.info; dispose(p) end; 
function Top(s: stack(item)): item; ee 
begin Top := st.info end; 
function StackIsMT(s: stack(item)): boolean; 
begin StackIsMT := (s = nil) end 


end; 


In een programma waarin deze structuur (of de vorige) is gedefini- 
eerd, zou daarna een stacktype gedefinieerd kunnen worden als: 


type IntStack = stack(integer); 


En er kunnen ook variabelen van een stacktype gedeclareerd worden: 


var sstackl: IntStack; 
pstack2: stack(real); 
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De operaties worden gerealiseerd door middel van procedure- res- 
pectievelijk functie-aanroepen: 


B iiy Creates(sstä&ki) ps. vas vpe Pushtpstack2, 1204) js. ee 


Een stack kan ook geïmplementeerd worden met behulp van een 
array, waarbij ‘opeenvolgende! elementen van de stack overeenkomen 
met 'achtereenvolgende! elementen van het array. Omdat een array 
een vast domein heeft (geen dynamische datastructuur is) is de 
stack bij deze implementatie wel beperkt in grootte. Bij de definitie 
van de structuur zouden we de maximale grootte van de stack mee 
kunnen geven als een parameter van de structuur. De stack wordt 
geïmplementeerd met behulp van het type 


record eln: arrayl1..maxstack] of item; 
top: O..maxstack 


end 


De abstractiefunctie is 

A((eln,top)) = (eln{top] ,...,eln[2],eln[1]) 
en de representatie-invariant: 

0 < top < maxstack 


implementation stackstructure; 
structure stack(type item; const maxstack: integer) = 
record eln: array[1..maxstack] of item; 
top: 0..maxstack Wee 
end; 
procedure CreateS(var s: stack(item,maxstack)); 
begin s.top := 0 end; 
procedure Push(var s: stack(item,maxstack) ; is item); 
{pre: 0 < s.top < maxstack 
post: zie definitie} 


begin s.top := s.top + 1; s.eln[s.top] := i end; 
procedure Pop(var s: stack(item,maxstack); var i: item); 
begin i := s.eln[s.topl; s.top := s.top - 1 end; 
function Top(s: stack(item,maxstack)): item; hee 
begin Top := s.elnls.topl end; 
function StackIsMT(s: stack(item,maxstack)): boolean; 
begin StackIsMT := (s.top = 0) end; 


function LenS(s: stack(item,maxstack)): integer; 
begin LenS := s.top end 
end; 


De gebruiker van deze structuur moet er zich van bewust zijn dat 
de operatie Push niet altijd kan worden uitgevoerd. De gebruiker 
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moet de lengte van de stack kennen. Vandaar dat een operatie is 
toegevoegd voor het bepalen van de lengte. Deze implementatie vol- 
doet niet aan de eerder gegeven specificatie van de stackstructuur 
en de gegeven definitie. We zouden een nieuwe specificatie en een 
nieuwe definitie moeten opstellen voor beperkte stacks. Daarna zou 
aangetoond kunnen worden dat bovenstaande implementatie voldoet 
aan deze nieuwe specificatie. 

In de structuurimplementatie hadden we een foutprocedure error 
kunnen opnemen en de body van de procedure Push had dan kunnen 
luiden: 


if s.top = maxstack then error else begin s.top := .... end 


Stel dat we de integer waarden die in input staan in omgekeerde 
volgorde in output moeten plaatsen en dat we weten dat het om ten 
hoogste 1000 integers gaat. We zouden dan kunnen declareren: 


var s: stack(integer, 1000); 


Het verplaatsen van de integers kan dan als volgt gerealiseerd wor- 
den: 


CreateS(s); 

while not eof do 

begin read(i); Push(s,i) end; 
while not StackIsMT(s) do ER 
begin Pop(s,i); write(i) end 


In de Inleiding van dit hoofdstuk hebben we een zelfde probleem 
gezien, waarbij we een stack hadden kunnen toepassen. We zullen 
nu enkele voorbeelden van het gebruik van stacks bekijken. Een 
stack is vooral toepasbaar in die gevallen waarin voor een rij 
X1X2X3 ... Xn-1Xn een operatie moet worden uitgevoerd waarbij x1 
en Xn samengenomen moeten worden, en x2 en xn-1, enzovoort. 
Neem bijvoorbeeld dat van input de som bepaald moet worden van 
het eerste en het laatste element en de som van het tweede en het 
op een na laatste element, enzovoort. We kunnen dit doen door x1 
op de stack te zetten, de rij x2x3... Xn-1 te verwerken (door x2 
op de stack te zetten en de rest te verwerken), xj van de stack af 
te halen en op te tellen bij xn. 


Voorbeeld 1 


De invoer bestaat uit karakters inclusief de karakters (, ), {, }, 

[ en ]. Gevraagd wordt om na te gaan of 'de haakjesstructuur cor- 
rect is'. De haakjesstructuur is correct als voor de rij van haakjes 
(de haakjes in de volgorde zoals ze in de invoer staan, de andere 
karakters negerend) geldt: 
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-C obd dJeof- ] 
- (X), {X}of [X], waarin X een rij haakjes is met een correcte 


haakjesstructuur 
- XY, waarin X en Y rijen haakjes zijn met een correcte haakjes- 


structuur. 


var st: stack(char); 
ec‚ch: char; 
correct: boolean; 
begin correct := true; 
CreateS(st); 
{inv.: (gehele invoerrij is correct) = correct A 
(st ~ (rest invoer) is correct) } 
while (not eof) and correct do 
begin read(c); ae 
dE lee "(Jor te 1E) orto wf!) 
then Push(st,c) 


else if fee ')') atole e ' HK or (e= "}) 
then if StackIsMT(st) 
then correct := false 
else begin Pop(st,ch); 
cCörrečt Fe (ch em 6} and {c = ')') 
or (ch = ESE, and (c = '}') 
or (ch = '[*) and (e = ']')) 
end 
end; Bek 
correct := correct and StackIsMT(st) 
end Ea 
Voorbeeld 2 


De binaire boom 
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is een voorstelling van de expressie (a +b /c) * (d -e *f). We 
krijgen deze expressie (afgezien van de haakjes) terug uit de boom, 
als de boom in in-order wordt afgelopen. Als de boom in pre-order 
wordt afgelopen krijgen we 


*+a/bc-d*ef 

En bij het aflopen in post-order 
abef.+def.e. 

We zagen deze boom eerder in hoofdstuk 5. 


De postfixnotatie voor een expressie is eenvoudig te interprete- 
ren: een operator moet worden toegepast op de twee direct eraan 
voorafgaande operanden (die zelf weer expressies in postfixnotatie 
kunnen zijn). Voor de prefixnotatie geldt dat een operator moet 
worden toegepast op de twee direct erop volgende operanden (die 
zelf weer expressies kunnen zijn in prefixnotatie). Een voordeel 
van beide notaties is dat er geen haakjes behoeven te worden 
gebruikt. 

We bekijken nu een algoritme voor het berekenen van de waarde 
van een expressie, die in postfixnotatie gegeven is als rij karakters 
in de sequence expr. We gaan er daarbij van uit dat de expressie 
correct is. Verder veronderstellen we omwille van de eenvoud dat 
in de expressiegeen unaire plus- of mintekens voorkomen en dat de 
operanden getallen zijn van één cijfer. (Deze beperkingen zijn niet 
essentieel.) Bij het berekenen van de waarde van een (deel)expressie 
in postfixnotatie moet een operator worden toegepast op de twee 
direct eraan voorafgaande operanden. Dit kan ook geformuleerd 
worden als: de twee operanden voor een operator moeten eerst ter 
beschikking staan voordat de operator kan worden toegepast. Maar 
het ter beschikking komen van een operand kan betekenen dat deze 
eerst uitgerekend moet worden. Daartoe kunnen we met vrucht 
gebruik maken van een stack: 


var Ss: stack(real); 


Deze stack bevat op elk moment de operanden van de nog niet geheel 
verwerkte (deel)expressies. Als het volgende karakter uit de 
sequence expr een operand is, wordt deze op de top van de stapel 
geplaatst. Is het een operator dan wordt deze operator toegepast op 
de 'bovenste twee! operanden van de stack. Het resultaat van deze 
operatie moet op de top van de stapel geplaatst worden ten behoeve 
van een volgende operatie. Voor de evaluatie van de expressie kun- 
nen we nu het volgende algoritme formuleren: 
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CreateS(s); 
{inv.: (waarde gehele rij) = 
while not SeqlIsMT(expr) do 
begin GetFirst(expr,c); 
4E (ordt) >» orat" oT) and. (ord(c) <= ordt '9')) 
then {operand} EE 
begin waarde := ord(c) - ord('0'); 
Push(s,waarde) 


(waarde st ~ (rest van de rij))} 


end 
else {operator} 
begin Pop(s,operand2); Pop(s,operand1l); 


case c of 


'+': waarde := operandl + operand2; 
'-!; waarde := operandl - operand2; 
'*!; waarde := operandl1 * operand2; 
'/': waarde := operandl / operand2 
end; 
Push(s,waarde) 
end 
end; Pr 
Pop(s,resultaat) 


Het is dus erg eenvoudig om een expressie in postfixnotatie te eva- 
lueren. Als we afzien van de vereenvoudigingen die we ons geper- 
mitteerd hebben, wordt het algoritme niet wezenlijk moeilijker. Als 
het zo gemakkelijk is om een expressie in postfixnotatie te evalue- 
ren, heeft het wellicht zin om van een expressie in infixnotatie, die 
geëvalueerd moet worden, eerst de overeenkomstige postfixnotatie 
te genereren en deze te evalueren. 

De infixnotatie van een expressie is alleen correct te interprete- 
ren als we van de operatoren de zogenaamde prioriteit kennen. Ten 
behoeve van het algoritme kennen we ook een prioriteit toe aan het 
openingshaakje en aan het speciale karakter '!' (dit karakter wordt 
als afsluiter van de stack gebruikt, als een sentinel bij het verge- 
lijken van prioriteiten van operatoren). 


aviameel ttl Wed 
proren: G- Oeh 


We gaan ervan uit dat de infixnotatie gegeven is in de sequence 


var inexp: sequence(char); 


De postfixnotatie wordt geplaatst in de sequence 


var expr: sequence(char); 
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Zoals eenvoudig is na te gaan komen de operanden in de infixnotatie 
en in de postfixnotatie in dezelfde volgorde voor. De operatoren 
krijgen een andere plaats en ook hun onderlinge volgorde verandert 
op basis van de prioriteiten. Een deelexpressie tussen haakjes moet 
als één geheel worden behandeld. Binnen zo'n geheel geldt dat 
operatoren met een lagere prioriteit pas in de postfixnotatie kunnen 
worden opgenomen als operatoren met een hogere prioriteit reeds 
zijn verwerkt. We kunnen hier weer gebruik maken van een stack 
waarin de nog niet verwerkte operatoren van de nog niet verwerkte 
deelexpressies worden opgenomen: 


var opst: stack(char); 


In de stack worden de operatoren van een deelexpressie in volgorde 
van toenemende prioriteit opgenomen; in de postfixnotatie worden 
ze opgenomen in volgorde van niet-stijgende prioriteit. We gaan 
ervan uit dat er een functie prior(c) ter beschikking staat, die 
voor c de prioriteit aflevert volgens bovenstaande tabel. Het algo- 


ritme luidt: 


CreateS(opst); Push(opst, '!'); 


CreateSeq(expr); 
{inv.: in opst staan de operatoren van de nog niet verwerkte deelexpressies 


(in de gegeven volgorde) in volgorde van toenemende prioriteit per 
deelexpressie, en de postfix van volledig verwerkte deelexpressies 
is reeds gegenereerd in expr} 
while not SeqIsMT(inexp) do 
begin GetFirst(inexp,c); 
if (ord(c) >= ord('0')) and (ord(c) <= ord('9')) 
“then PutLast (expr,‚c) 


else ift o ey 
then {het begin van een deelexpressie} 
Push(opst,c) 
else if œs ')" 
then {einde deelexpressie; deze evalueren: } 
begin Pop(opst,d); 
while d <> '(' do 
begin PutLast (expr,‚d); 
Pop (opst,d) 
end 
end te 
else {operatoren met hogere prioriteit van de 
stack halen: } 
begin while prior(c) <=prior(Top(opst)) do 
begin Pop(opst,d); 
PutLast (expr,d) 
end; 
Push (opst,c) 
end 
end; E 
Pop(opst,c); 
while c <> '!' do 


begin PutLast (expr,‚c); Pop(opst,c) end 


190 Voortgezet programmeren 


Voorbeeld 3 


Een stack kan gebruikt worden om de recursiviteit uit een algoritme 
te verwijderen. Stel dat de volgende recursieve procedure wordt 
uitgevoerd: 


procedure P(...); 


begin A; 
AE en 
ER aa 
else P(...)? 
B 
end 


Hierin zijn A en B stukken programmatekst waarin geen aanroepen 
van P voorkomen. Het tengevolge van de recursieve procedure uit- 
gevoerde proces kunnen we als volgt in beeld brengen: 


A A A ir A JA BLB {A OB/B, B, 


Voor de lokale variabelen van de procedure geldt dat deze op elk 
niveau (voor elke Aj en Bi) uniek zijn (niets van doen hebben met 
de variabelen met dezelfde namen op de andere niveaus). Als nu bij 
elke nieuwe uitvoering van de procedure de lokale variabelen op de 
top van de stack worden geplaatst en bij beëindiging van die uitvoe- 
ring van de stack worden verwijderd, dan zal op elk moment de 
'heersende toestand' zijn vastgelegd door de 'bovenste' plaatsen van 
de stack. Bij de uitvoering van Bj bevatten de bovenste plaatsen 
van de stack de variabelen die juist voor de uitvoering van Aj wer- 
den geintroduceerd. Als nu in een programmeertaal recursie niet is 
toegestaan, kan met behulp van een stack het recursieve gedrag 
van een algoritme gesimuleerd worden. 

In de algoritmen die volgen wordt met binaire zoekbomen gemani- 
puleerd. Deze bomen zijn gedefinieerd op de wijze zoals dat in Pascal 
mogelijk is, dus met behulp van pointers. We gaan uit van het type: 


type knoop = record c: integer; l,r: îtknoop end; 


Als voorbeeld van het vervangen van recursie door iteratie met 
behulp van een stack nemen we het in-order plaatsen van de knopen 
(de integer waarden in de knopen) van een binaire zoekboom in 
output (de standaard outputfile). De boom is gegeven in variabele 
wortel van het type tknoop. We introduceren nog: 


type boom = fknoop; 
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We bekijken eerst de recursieve oplossing. De waarden uit de boom 
worden in de juiste volgorde in output geplaatst door de aanroep 
printrec(wortel) van de procedure 


procedure printrec(w: boom); 
begin if w <> nil 
~ then begin printrec(wt.l); 
write(wt.c); 
printrec(wt.r) 
end 
end gen 


Dit voorbeeld lijkt niet te passen bij de algemene vorm die we eerder 
gaven: er komen geen lokale variabelen in voor en de stukken A en 
B uit de algemene vorm ontbreken. Maar wat we eerder zeiden over 
de lokale variabelen geldt ook voor de waarden van de parameters. 
In het voorbeeld moet de waarde van de wortel van de parameter 
bewaard worden totdat de totale linkerboom van de betreffende 
wortel is afgedrukt. Deze volgorde wordt door de recursie gegaran- 
deerd, bij iteratie moeten we daar zelf voor zorgen. De stack die 
gebruikt zou worden voor lokale variabelen wordt ook gebruikt voor 
de parameters. 

In de volgende iteratieve procedure wordt als invariant gebruikt: 


Van het knooppunt op de top van de stack is de linker 
subboom in output geplaatst (en de stack bevat verder 
de ‘voorvaderen! van het topelement (waarvan dit top- 
element in de linker subboom zit)) 


De procedure luidt 


procedure printit(w: boom); 
var S: stack(boom); 
P‚q: boom; 
begin if w <> nil 
then begin CreateS(s); 
q := W; p := wt.l; 
while p <> nil do 
begin Push(s,q); q := p; p := pt.l end; 
Push(s,q); 
{dit was de initialisatie; de invariant geldt} 
while not StackIsMT(s) do 
begin Pop(s,‚p); write(pt.c); 
if pt.r <> nil 
then begin q := pt.r; p := qt.l; 
while p <> nil do 
begin Push(s,q); 
q := p; p := pt.l 


end; 
Push(s,q) 
end 


end 
end; 
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De waarde uit de boom (waar wortel naar wijst) worden in output 
geplaats door uitvoering van printit(wortel). 

Voor het realiseren van recursie kan van een stack gebruik wor- 
den gemaakt. Als deze stack nu op zijn beurt gerealiseerd wordt 
met behulp van een array, dan zou de bovenstaande procedure niet 
werken voor een boom met een willekeurige 'diepte'. Dit door de 
beperking in het domein van het array. In veel computersystemen 
wordt dan ook bij recursie een bovengrens opgelegd aan de zoge- 
naamde recursiediepte. (Voor op dat systeem geïmplementeerde 
talen waarin recursie is toegestaan.) 

Het is niet altijd nodig om bij het vervangen van recursie door 
iteratie een stack te gebruiken. Als er voor de Bi (uit de algemene 
vorm van een recursieve procedure, zie bladzijde 190) niets ont- 
houden behoeft te worden van de Aj, is een stack niet nodig. Een 
vast aantal variabelen kan dan voldoende zijn om alle toestanden 
vast te leggen. Het vervangen van recursie door iteratie wordt dan 
erg eenvoudig. Stel bijvoorbeeld dat we bij een gegeven binaire 
zoekboom willen nagaan of de waarde n erin voorkomt. Dit kan 
gerealiseerd worden door een aanroep van de volgende recursieve 
functie: 


function zoekl(n: integer; w: boom): boolean; 
begin if w = nil 


then zoek1 := false 
else if n = Wi.C 
then zoekl := true 


zoekl(n,wt.l) 
zoekl(n,wi.r) 


else if n<wt.c then zoek1 : 
else zoekl : 


end; 


Hetzelfde effect is te realiseren door een aanroep van de iteratieve 
functie: 


function zoek2(n: integer; w: boom): boolean; 
var p: boom; gevonden: boolean; 
begin if w = nil 
then zoek2 := false 
else begin p := w; gevonden := false; 
{inv.: gevonden = (n komt voor in het 
wortelpad van p) } 

while (p <> nil) and not gevonden do 


if n= ptsc 
then gevonden := true 
elise IL n © dt,e 
then p := pt.l 
else p := pt.r; 
zoek2 := gevonden 


end 
end; ð 
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Afsluitende opmerking 


De stack is een dynamische datastructuur. Als deze geimplementeerd 
moet worden kan het best gebruik gemaakt worden van een andere 
dynamische datastructuur, zoals bijvoorbeeld een ketting. Als 
gebruik wordt gemaakt van een array verliest de stack zijn dyna- 
misch karakter. 

Bij de implementatie met behulp van een array hebben we gekeken 
naar het geval van één stack. Elke stack werd geimplementeerd in 
een eigen array. Er zijn speciale implementaties bekend om meerdere 
stacks in één array onder te brengen. Zo kunnen twee stacks in 
één array geimplementeerd worden door de beide 'uiteinden' van 
het array te gebruiken als de 'bodems' van de stacks. De stacks 
zullen dan naar elkaar toegroeien. Deze implementatie kan gebruikt 
worden als bekend is dat de som van de lengtes ten hoogste N is, 
waarbij de lengte van de afzonderlijke stacks niet bekend hoeft te 
zijn. 


QUEUES 


De definitie van de queue is (wederom de semantiek uitgedrukt in 
termen van sequences): 


definition queuestructure; 
structure queue(type item); 
procedure CreateQ(var q: queue(item)); 
{pre: true 


post: q= ( )} 
procedure PutQ(var q: queue({item); i: item); 
pre: q = X 


post: q= xa (i)} 

procedure GetQ(var q: queue(item); var i: item); 
pre: q = (c) ~ x en 
post: q =x A ic} 

function QISMT(q: queue(item)): boolean; 


{pre: q= x 

post: QIsMT (q) = (x= ( ))} 
function FirstQ(q: queue(item)): item; 

pre: q = (c) ~x 


post: q = (c) ~ x A FirstQ(g) = c} 
end; 
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Zoals een stack kan ook een queue geïmplementeerd worden met 
behulp van een enkelvoudige geketende ketting: 


front rear 
GetQ = Puto 


De abstractiefunctie is: 


A((nil,nil)) =( ) 
Ala) = (front+.info,...,reart.info) 


en de representatie-invariant: 
front = nil e rear = nil. 
De implementatie van de queuestructuur wordt dan: 


implementation queuestructure; 
structure queue(type item) = record front, rear: Îtgel end; 
type gel = record info: item; next: tgel end; 
procedure CreateQ(var q: queue( item) ); 
begin q.front := nil; q.rear := nil end; 
procedure PutQ(var q: queue(item); i: item); 
var p: Agel; 
begin new(p); pt.info := i; pt.next := nil; 
if q.rear = nil then q.front := p 
else q.reart.next := p? 


qg.rear := p 
end; 

procedure GetQ(var q: queue ( item); var i: item); 
var p: Îgel; 
begin p := q.front; i := q.frontt.info; 


q.front := q.frontt.next; 
if q.front = nil then q.rear := nil; 
dispose(p) 


end; 
function OISMT(q: queue(item)): boolean; 
begin QISMT := (q.front = nil) {and (q.rear = nil)} end; 
function FirstQ(q: queue({item)): item; 
begin FirstQ := q.frontt.info end 
end; 
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In een programma waarin deze structuur is gedefinieerd, zou daarna 
een queuetype gedefinieerd kunnen worden. Als basistype een 
reeds gedefinieerde typenaam is, zou gedefinieerd kunnen worden: 


type basqueue = queue(basistype); 


En er kunnen ook variabelen van een queuetype gedeclareerd wor- 
den: 


var basq: basqueue; 
intqueue: queue(integer); 


De operaties worden gerealiseerd met behulp van procedure- respec- 
tievelijk functie-aanroepen: 


.……f CreateQ(basg); .….….; PutQ(intqueue;24); .…. 
if QIsMT(intqueue) then ... 


De queuestructuur kan ook geïmplementeerd worden met behulp van 
een array. Om te voorkomen dat de beschikbare ruimte in het array 
te snel opgebruikt raakt, vat men het array circulair op: de opvol- 
ger van de plaats in het array met de grootste index is de plaats 
met de kleinste index. De grootte van het array is dan de boven- 
grens voor de grootte van de queue. Uiteraard zijn we op deze 
manier het dynamisch karakter van de queue enigszins verloren. 
We kunnen de maximale grootte van de queue weer als parameter 
opnemen in de implementatie van de structuur. 


implementation queuestructure; 
structure queue(type item; const maxsize: integer) = 
record eln: arrayl0O..maxsize - 1] of item; 
front,rear: O..maxsize Lo 


end; 
procedure CreateQ(var q: queue(item,maxsize)); 


end 


Er doet zich nu echter een klein probleempje voor: de toestand dat 
het array 'vol' is en de toestand van de lege queue worden beide 
gekarakteriseerd door front = rear + 1 (of het speciale geval: 

rear = maxsize- 1 en front = 0). Dit wordt veroorzaakt door het 
circulaire karakter van het array. Als we het array niet circulair 
opvatten, kunnen we de moeilijkheid van het volraken van het array 
zonder dat de queue bestaat uit maxsize elementen, opvangen door 
na elke GetQ-opdracht de queue terug te 'schuiven!' tegen de 'voor- 
kant! van het array (zodat steeds geldt: front = 0). Maar deze 
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oplossing is met het oog op efficiëntie niet erg aantrekkelijk. We 
blijven dus maar bij het circulaire array en zoeken een andere 
oplossing voor het gesignaleerde probleem. Een eerste oplossing is 
om front de index te laten zijn van het element dat voorafgaat aan 
het eerste element van de queue. Dat de queue zijn maximale omvang 
heeft bereikt, kan dan gekarakteriseerd worden door: front = rear + 1. 
De lege queue wordt gekarakteriseerd door: front = rear. Met deze 
oplossing worden de operaties Putg, GetQ, QIsMT en FirstQ gereali- 
seerd door: 


procedure PutQ(var q: queue(item,maxsize); i: item); 


begin q.rear := (q.rear + 1) mod maxsize; 
if q.rear = q.front then error 
BE else q.elnlq.rearl := i 
end; 
procedure GetQ(var q: queue(item,maxsize); var i: item); 
begin qg.front := (g.front + 1) mod maxsize; 
i i= q.elnlq.front] 
end; 
function QISMT(q: queue(item,maxsize)): boolean; 
begin QISMT := (q.front = q.rear) end; 
function FirstQ(q: queue(item,maxsize)): item; 
begin FirstQ := g.elnl(q.front + 1) mod maxsizel end 


Het nadeel van deze oplossing is dat niet het gehele array wordt 
benut; het maximale aantal elementen van een queue is nu maxsize-1. 

We hebben verondersteld dat in de structuurimplementatie een pro- 
cedure error is opgenomen, die geactiveerd wordt als een Putg zou 
moeten worden uitgevoerd als de queue vol is, De gebruiker moet nu 
voor zichzelf bijhouden wat het aantal elementen van de queue is om 
te voorkomen dat deze situatie optreedt. We kunnen dan beter de 
gebruiker een functie QLen ter beschikking stellen, zodat in het 
algoritme waarin van deze queuestructuur gebruik wordt gemaakt 
elke activering van PutQ voorafgegaan kan worden door een active- 
ring van QLen (en de activering van PutQ eventueel achterwege 
blijft). Bij de bovenstaande implementatie, aangevuld met QLen is 
het wat verwarrend dat de queue vol is als QLen als resultaat geeft 
maxsize - 1. Maar doordat we nu hebben gesproken over de lengte 
van de queue hebben we ook direct een ander idee om het eerder 
gesignaleerde probleempje op te lossen. Met deze nieuwe oplossing 
wordt het totale array benut. We nemen in de typedefinitie naast 
front en rear nog een derde variabele op: length. We krijgen dan 
als implementatie voor de structuur: 
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implementation queuestructure; 
structure queue(type item; const maxsize: integer) = 
record eln: array[0..maxsize=- 1] of item; 
front,rear, length: O..maxsize 


end; 
procedure error; 
procedure CreateQ(var q: gueue(item,maxsize)); 
begin q.front := 0; qg.rear := 0; q.length := 0 end; 
procedure PutQ(var q: queue(item,maxsize); i: item); 
begin if q.length = maxsize 
then error 
else begin q.rear := (q.rear +1) mod maxsize; 
qg.elntqgsréarl re di =- 
q. length := q.length + 1 


end 
end; 
procedure GetQ(var q: queue(item,maxsize); var i: item); 
begin if q.length = 0 Re 
~ then error 
else begin i := q.eln[q.front]; 
q. front := (q.front +1) mod maxsize; 
q. -length := q.length - 1 


end 

end; 

function QIsMT(q: queue(item,maxsize)): boolean; 
begin QISMT := (length = 0) end; 

function QLen(q: queue (item, maxsize)): integer; 
begin QLen := q.length end; 

function FirstQ(q: queue (item, maxsize)): item; 
begin FirstQ := q.eln[q.front] end 


end; 


In plaats van met de lengte van de queue zouden we ook nog met 
booleans voor het vol en leeg zijn kunnen werken. 

Het gebruik van een queue hebben we al gezien in het eerste 
voorbeeld van 7.2, waarbij de sequence h als queue gebruikt werd. 
Queues kunnen gebruikt worden in allerlei situaties waarin wacht- 
rijen (het woord zegt het al) een rol spelen. 
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7.5 OPGAVEN 


1. Geef de implementatie van de queuestructuur met behulp van 
sequences. 


2. Herschrijf het algoritme van voorbeeld 1 van paragraaf 7.2, 
waarbij gebruik gemaakt wordt van een queue. 


3. De invoerrij bestaat uit een rij gehele getallen. Schrijf een pro- 
cedure voor de bepaling van het aantal verschillende waarden in 
de rij 


a. als de rij monotoon niet-dalend gesorteerd is; 
b. als de rij ongesorteerd is. 


4. De variabele 
var s: sequence(integer); 


bevat de rij n‚aj,ag,...,ak bestaande uit positieve integers. 
De rij aj,ag,...,ak bevat ten minste n+1 verschillende waarden 
(dus k 2n+1). 

Gevraagd wordt van de rij aj,ag,...,aK de op n na grootste 
waarde te bepalen en het aantal malen dat deze in de rij voorkomt. 


a. Maak gebruik van een array als hulpvariabele. 
b. Maak gebruik van een sequence als hulpvariabele. 
5. Gegeven: 


var g: sequence (integer); 


Beschouw de rij g als g = g0,g1,...gķ (K > 0 en onbekend). 
De rij g is niet-dalend gesorteerd en Davi uitsluitend positieve 
getallen: 1 < gg < g1 SS... S Ek: 

Met behulp van de rij g definiëren we een nieuwe rij h: 

h =ho,hj,--.‚hk met 


hi = go * 8: 


Neo tE, t t 
Ontwerp een algoritme dat berekent: de rij getallen die bestaat 


uit de getallen van de rijen g en h en die niet-dalend gesorteerd 
is. 
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6. 


Gegeven: 


type woord = sequence(char); 
type zin = sequence (woord); 
type verhaal = sequence(zin); 
var tekst: verhaal; 


De variabele tekst heeft een waarde waarvoor geldt dat alle waar- 
den van het type woord die erin voorkomen bestaan uit: 


- ofwel allemaal kleine letters; 
- ofwel een hoofdletter gevolgd door een aantal (2 0) kleine 
letters. 


De waarden van het type woord die met een hoofdletter beginnen, 
noemen we namen. 

Van alle namen die in tekst voorkomen moet een index gemaakt 
worden. Dit betekent dat voor elke naam alle verschillende zins- 
nummers bepaald moeten worden van de zinnen waarin de naam 
voorkomt, zodanig dat bij elke naam de zinsnummers in stijgende 
volgorde staan vermeld. Elke naam mag slechts één keer in de 
index voorkomen. 

Ontwerp een algoritme dat aan de variabele index de hierboven 
omschreven waarde geeft: 


type elt = record naam: woord; regnrs: sequence(integer) end; 
var index: sequence(elt); 


Veronderstel een rustplaats voor vakantiegangers per bus. In een 
bus zitten een aantal personen (zeg aant), de bus komt aan op 
een bepaald tijdstip (zeg at) en de bus vertrekt op een bepaald 
tijdstip (zeg vt). 

Deze gegevens zou men kunnen typeren door: 


type bus = record aant: 0..maxint; at,vt: real end; 
Als b een waarde is van het type bus dan geldt: b.at < b.vt. 
Gedurende een bepaalde periode doen een aantal bussen deze 
rustplaats aan. De gegevens van deze bussen zijn vastgelegd in: 


var input: sequence (bus); 


De aankomsttijden van deze bussen zijn geordend; stel: 


input = (bibo Das...) 
dan geldt: 
Pirat: Bent sDet Lips 


1 2 3 
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Verder is gegeven dat geen enkele aankomsttijd en/of vertrektijd 
samenvalt met een andere aankomsttijd en/of vertrektijd. 
Gevraagd wordt een algoritme te ontwerpen dat het grootste aan- 
tal personen bepaalt dat zich op enig tijdstip op de rustplaats 
bevindt en tevens de totale tijd gedurende welke dit maximale 
aantal personen op de rustplaats aanwezig is. Deze gegevens 
dienen vastgelegd te worden in: 


var tot : 0..maxints; 
tijd: real; 


8. Gegeven: 


type nat = 1..maxint; 
var s: sequence(nat); 
dif: nat; 
aant: 0..maxint; 


De variabelen s en dif hebben een waarde. 

De elementen in de sequence s zijn niet-dalend gesorteerd. 
Ontwerp een algoritme dat aan aant als waarde toekent het aantal 
malen dat er in seen tweetal elementen voorkomt waarvoor geldt 
dat het verschil van die twee elementen gelijk is aan dif. 
Voorbeeld: 


als s = (9,9,11, 12, 12, 14,15, 18, 25) 
en dif = 3 
dan is 8 het gevraagde aantal. 


a. Los dit probleem zo op, dat alleen enkelvoudige variabelen en 
arrays als hulpvariabelen gebruikt worden. 

b. Los dit probleem zo op, dat alleen enkelvoudige variabelen en 
sequences als hulpvariabelen gebruikt worden. 


9. Een postkantoor heeft twee loketten. Het postkantoor opent om 
8 uur, 0 minuten en sluit om 17 uur, 59 minuten. Het postkan- 
toor is dus 599 minuten geopend. Een aantal bezoekers maakt van 
de diensten van het postkantoor gebruik. Als een bezoeker bij 
het postkantoor aankomt, en een van de loketten is vrij, wordt 
hij/zij direct geholpen. Als een bezoeker aankomt en beide loket- 
ten zijn bezet, sluit hij/zij aan bij een (voor beide loketten 
gemeenschappelijke) wachtrij. Als een loket vrijkomt en de 
wachtrij is niet leeg, dan is de langstwachtende bezoeker aan de 
beurt. Aldus wordt ervoor gezorgd dat de bezoekers in volgorde 
van aankomst aan de beurt komen. 


Gegeven: 
type tijdstip = record u: 8..17; m: 0..,59 end; 


type bezoeker record at: tijdstip; bt: 04.599 end; 
var p: sequence (bezoeker); 
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eden ere en 


10. 


tl, 


De sequence p bevat de gegevens van alle bezoekers op één dag. 
Per bezoeker zijn gegeven de aankomsttijd (at) en de bedienings- 
tijd (bt). De sequence p is geordend op aankomsttijd, met andere 
woorden: 


als p = (P1 Po Posee.) dan geldt: 
p‚-at is vroeger dan P‚,j-ât voor alle i 2 1. 


Verder is gegeven dat de aankomsttijden en bedieningstijden 
zodanig zijn dat de laatste bezoeker zeker niet later dan 17 uur, 
99 minuten zal vertrekken. 


Gevraagd: Geef de variabele 
Var VOE: 099, 


als waarde de totale tijd (gemeten in minuten) dat de wachtrij 
niet leeg is, 


Gegeven zijn de volgende datastructuren: 


type regel = record g: 1..100; pos: sequence( integer ) end; 
var geg: sequence(l..100); 
En CR integer; 

out: sequence(regel); 


De variabelen geg, m, n hebben een waarde, met 1 < msn. 
Ontwerp een algoritme dat voor iedere waarde uit geg die mini- 
maal m doch maximaal n keer voorkomt, een element van het type 
regel aan de sequence out toevoegt, waarvoor geldt: 


- g bevat de waarde uit geg; 
- pos bevat de rangnummers van de posities waarop de waarde 
in geg voorkomt. 


Verder moet out monotoon stijgend gesorteerd zijn op de waarde 
van de eerste component van ieder element en dient het totale 
geheugengebruik onafhankelijk te zijn van het aantal elementen 
in geg. 


Bij een grensovergang worden door de douane zowel de papieren 
als de bagage gecontroleerd. Hiertoe zijn twee controlestations 
ingericht: 


- één voor de controle van de papieren; 
- één voor de controle van de bagage. 


De auto's komen eerst aan bij de papierencontrole. Ze passeren 
de papierencontrole in de volgorde van aankomst. 
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Om te voorkomen dat de wachtrij voor de controle van de papie- 
ren te lang wordt, hanteert de beambte bij de papierencontrole 
de volgende regel: 

Als, op het moment dat een auto de papierencontrole verlaat, de 
wachtrij langer dan 25 auto's is, worden er zoveel auto's zonder 
enige controle doorgelaten tot er nog 15 auto's in de rij aanwezig 
zijn. | 

Voor zo'n auto die zonder enige controle doorgelaten wordt, ein- 
digt het oponthoud op het moment dat die zijn weg mag vervol- 
gen. 

Van alle auto's waarvan de papieren gecontroleerd zijn wordt 
elke derde doorgestuurd naar de bagagecontrole; voor de andere 
twee eindigt het oponthoud bij het verlaten van de papierencon- 
trole. Alle auto's waarvan de bagage gecontroleerd moet worden, 
worden in volgorde van aankomst behandeld. Voor deze auto's 
eindigt het oponthoud op het moment dat de bagagecontrole ver- 
laten wordt. 


Gegeven: 


type tijdstip = 0.. 1440; 
var aankomst: sequence(tijdstip); 


De variabele aankomst bevat - in stijgende volgorde - de aankomst- 
tijden van alle auto's die gedurende één dag tussen 0.00 en 24.00 
uur bij de grensovergang aankwamen; elke aankomsttijd is gege- 
ven als het aantal minuten ná 0.00 uur dat de auto bij de papie- 
rencontrole aankwam. 

De tijdsduur van de controle op papieren van één auto wordt 
bepaald door een aanroep van de function randompap met als 
semantiek: vit 


{true} x := randompap {0 < x < 5 en x geheel}. 


De tijdsduur van de controle op bagage van één auto wordt 
bepaald door een aanroep van de function randombag met als 
semantiek: 


{true} x := randombag {0 < x < 15 en x geheel}. 


Ontwerp een algoritme dat het gemiddelde oponthoud berekent 
voor alle auto's die tussen 0.00 en 24.00 uur bij de grensover- 
gang aankwamen. Hierbij mag er van worden uit gegaan dat er 
om 0.00 uur geen enkele auto aanwezig was. 


Opmerking: De tijdsduur van optrekken en aansluiten in een 
wachtrij, en voor het gaan van papierencontrole naar bagage- 
controle, is verwaarloosbaar en hoeft dus niet te worden meege- 
rekend. 
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12. Gegeven: 
var S: sequence(integer); 


s heeft een waarde en s ž ( ). 

Als we de waarde van s beschouwen als (s0,S1,..»,Sn) kunnen 
we een segment van s definiëren als een deelrij (si, ...sSi+p) 
met 0 < i en itp < n; de lengte van zo'n segment is dan pi. 
We noemen een segment (sj,... ‚Sj+p) van s linksmaximaal als 
geldt: 


(Axsi:s xs i+p : (s; 2 S )) 


dat wil zeggen een linksmaximaal segment is een segment waar- 
van het linker element het maximum is. 


Ontwerp een algoritme dat de lengte van het langste linksmaxi- 
male segment van s bepaalt. 
13. Gegeven: 


var S: sequence(1..maxint); 


S heeft een waarde en bevat ten minste één element. 


Zij a1,22,...,an een rij positieve integers, dan gelden de vol- 
gende definities: 


Ai,Ai+1,-+s-,;Ak (1< i<k sn) iseen even groep met k-i+1 ele- 
menten indien geldt: 


TA a, mod 2 = 0 

E E a FA k : (a; F a;)) 

Ai,Aj+1,-+-+AkK (1 Si<k Sn) iseen oneven groep met k-i+1 
elementen indien geldt: 

A a, mod 2 #0 

Ak es Fa,)) 


a =a 
1 


Gevraagd: Ontwerp een algoritme dat bepaalt: 


- het aantal elementen van de grootste even groep in S; 

- het aantal elementen van de grootste oneven groep in S; 
- het aantal even groepen in S; 

- het aantal oneven groepen in S. 
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14. 


15. 


Een N * N matrix heet ijl als van de N? elementen er slechts zeer 
weinig £ 0 zijn. 

Een normale manier om matrices te representeren is in een N * N 
array. Bij ijle matrices zullen vele array-elementen de waarde 0 
hebben. Voor grote N is het efficiënt (in geheugengebruik) 
alleen de waarden van de elementen # 0 te representeren, en die 
van de elementen = 0 niet. Het is dan wel nodig op een of andere 
manier de 'plaats!' van zo'n element ((i,j) met 1<i <N a1<j <N) 
te karakteriseren! 


a. Ontwerp een definition module voor de structure ijlematrix 
met als operaties: 


- creëren zó dat alle elementen nul zijn; 
- het toekennen van een waarde £ 0 aan een element; 
- het sommeren van de elementen op de diagonaal. 


b. Ontwerp een implementation module voor de structure 
ijlematrix met de onder a. genoemde operaties. 
Mogelijke implementaties zijn: 


- met pointers, een lineaire lijst per kolom en per rij die ele- 
menten £ 0 bevat (een element # 0 komt dus in twee lijsten 
voor) ; 

- een sequence van sequences, waarbij een sequence één rij 
representeert. 


Kies één van de twee genoemde implementatiemogelijkheden. 
Natuurlijke getallen in het decimale stelsel kunnen worden gere- 


presenteerd met behulp van datastructuren, zodanig dat ieder 
cijfer van het getal een element is van de datastructuur. 


a. Twee aldus gerepresenteerde getallen kunnen worden opge- 
teld. Het resultaat van de optelling dient op dezelfde wijze in 
een datastructuur te worden vastgelegd. 


l. type getall = sequence(0..9); 


Construeer de functie som1 die de volgende heading heeft: 


function soml(s,t: getall): getall; 


De functie som! bepaalt de som van twee natuurlijke getal- 
len die gerepresenteerd zijn met behulp van een sequence 
en representeert het resultaat ook met behulp van een 
sequence. 


2. De getallen worden nu gerepresenteerd met behulp van 
een lineaire lijst. 
type digit = record cijfer: 0..9; p: tdigit end; 
type getal2 = fdigit; 
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Construeer de functie som2 die de volgende heading heeft: 
function som2(s,t: getal2): getal2; 


De functie som2 bepaalt de som van twee natuurlijke 
getallen die gerepresenteerd zijn met behulp van een line- 
aire lijst en representeert het resultaat ook met behulp van 
een lineaire lijst. 


b. Twee aldus gerepresenteerde getallen kunnen worden verme- 
nigvuldigd. Het resultaat van de vermenigvuldiging dient op 
dezelfde wijze in een datastructuur te worden vastgelegd. 


1. Construeer de functie prod1 die de volgende heading heeft: 
function prodi(s,t: getall): getal1; 
De functie prod bepaalt het produkt van twee natuurlijke 
getallen die gerepresenteerd zijn met behulp van een 
sequence en representeert het resultaat ook met behulp 
van een sequence. 
Er mag gebruik worden gemaakt van de functie 
function soml(s,t: getall): getall; 


die de som van twee natuurlijke getallen bepaalt met een 
sequence als representatie. 


2. Construeer de functie prod2 die de volgende heading heeft: 
function prod2(s,t: getal2): getal2; 
De functie prod bepaalt het produkt van twee natuurlijke 
getallen die gerepresenteerd zijn met behulp van een line- 
aire lijst en representeert het resultaat ook met behulp van 
een lineaire lijst. 
Er mag gebruik worden gemaakt van de functie 
function som2(s,t: getal2): getal2; 


die de som van twee natuurlijke getallen bepaalt met een 
lineaire lijst als representatie 


c. Gehele getallen kunnen worden weergegeven door middel van 
het type: 


type gehgetal = record sign: (plus,min), natg: getal end; 
Construeer met behulp van de functie prod! uit vraag b.1. 
function prod3(s,t: gehgetal): gehgetal; 


die het produkt van twee gehele getallen bepaalt. 


8 VERZAMELINGEN 


8.1 INLEIDING 


Uitgaande van een reeds gedefinieerd type basistype kunnen we in 
Pascal definiëren: 


type P = set of basistype; 


De waardenverzameling van P heeft als elementen alle deelverzamelin- 
gen van de waardenverzameling van basistype. Als gedefinieerd is 


type basistype = 1..3; 


dan is de waardenverzameling van P: 
{o,{1},(2},{3},{1,2},{1,3},{2,3},{1,2,3}} . 

In Pascal worden deze constanten van het type P genoteerd als 
[ J,[1],[2],[3],[1,2],..., [1,2,3]. 


Als de waardenverzameling van het basistype n elementen bevat, 
dan bevat de waardenverzameling van P (de powerset, de machts- 
verzameling van de waardenverzameling van het basistype) 20 ele- 
menten (die verzamelingen zijn). 

De settypen kunnen opgevat worden als enkelvoudige of als 
samengestelde typen. Een settype is enkelvoudig als de ( voornaam- 
ste) operaties werken op verzamelingen als argumenten en verzame- 
lingen als resultaat hebben. Voorbeelden van dit soort operaties 
zijn de bekende verzamelingsoperaties als de doorsnede, de vereni- 
ging en het verschil van twee verzamelingen. Een voorbeeld is de 
set in Pascal met bovenstaande definitie. Een settype is samenge- 
steld als de (voornaamste) operaties ook elementen als argument of 
als resultaat hebben. De in hoofdstuk 6 geïntroduceerde set met als 
operaties insert, delete en min, was samengesteld. 
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8.2 DE SET ALS ENKELVOUDIG TYPE 


Voor het settype beschikken we over de assignment en de test op 
gelijkheid. Daarnaast over operaties als: 


doorsnede : a N b 
vereniging: a U b 
verschil :a nb 


Bovendien kan getest worden of een waarde van het basistype een 
element is van een waarde van een bijbehorend settype: w € s. 

Er zijn talen waarin deelverzamelingen van verzamelingen gese- 
lecteerd kunnen worden, bijvoorbeeld als: 


{xEsl|P(x)} 


Deze verzameling, een waarde van het settype van s, is de deelver- 
zameling van s bestaande uit die elementen van s die de boolean 
expressie P de waarde true op laten leveren. De x is een formele 
naam voor de elementen die gebruikt wordt in de boolean expressie 
B. 

Tenslotte zijn er de boolean operaties 'deelverzameling' en '‘omvat- 
tende verzameling: 


'a is een deelverzameling van b' :acb 
‘a is een omvattende verzameling van b': a 2 b 


In Pascal zijn de settypen enkelvoudige typen met als notaties voor 
de beschikbare operaties: 


vereniging + 
doorsnede * 
verschil == 
element van : in 


deelverzameling © €= 
omvattende verzameling: >= 


Voorbeeld 1 


Een project bestaat uit honderd activiteiten, genummerd van 1 tot en 
met 100. Sommige van deze activiteiten kunnen gelijktijdig plaats- 
vinden, terwijl andere na elkaar moeten plaatsvinden omdat de ene 
activiteit de resultaten nodig heeft van één of meer andere. Van 

elke activiteit is gegeven welke andere activiteiten pas kunnen 
starten op het moment dat deze activiteit beëindigd is. Deze gege- 
vens zijn vastgelegd in: 


type opvolger = set of 1..100; 
var act: array[1..100] of opvolger; 
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De variabele act heeft een waarde die consistent is: het kan niet 
voorkomen dat activiteit a opvolger is van b en dat activiteit b 
opvolger is van activiteit a. 

Elke activiteit duurt één dag. Gevraagd wordt het minimale aan- 
tal dagen dat nodig is om het project te voltooien. 

Voorbeeld met zes activiteiten: 


activiteit opvolgers 
1 
2 1,5 
3 2,5 
4 2 
5 
6 3,4 


Het minimale aantal dagen voor het project is 4. 

Als alle activiteiten, die geen opvolgers hebben, verwijderd wor- 
den uit het project, noemen we het overblijvende project éénmaal 
gereduceerd ten opzichte van het oorspronkelijke project. Dit gere- 
duceerde project vraagt één dag minder dan het oorspronkelijke 
project. Op het gereduceerde project passen we weer een reductie 
toe, enzovoort. Als er n reducties moeten worden toegepast om tot 
een project te komen dat geen enkele activiteit meer bevat, kost het 
oorspronkelijke project n dagen. 

We introduceren: 


var ad: 0..100; {het aantal toegepaste reductieslagen} 
rest: set of 1..100; {nummers van de activiteiten die 
in het gereduceerde project 
voorkomen } 
laatste: set of 1..100; {de deelverzameling (van rest) 
van die activiteiten in het 
gereduceerde project die geen 
opvolger (s) hebben} 


De betekenissen van ad, resten laatste houden we invariant. Het 
Pascal-programmadeel ter bepaling van het minimale aantal beno- 
digde dagen voor het project kan dan luiden: 
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ad ne Pi test. am ll. rt00lz: [4 t00) = {44 2,3,.:6,;100}} 
laatste := { ]; 
for 1 ;= 1 to 100 do if actlil = [ ] then laatste := laatste + [i]; 
{invariant} — EE 
while rest <> [ ] do 
begin rest := rest - laatste; ad := ad + 1; 
laatste se [ Jz 
for i sf EO 100 do 
feet and (actlil «rest = Et) 
~ then laatste := laatste + fij 
end Ad 


Voorbeeld 2 


Gegeven zijn de volgende typen: 


Lype Cursus = (A,B‚C,D,E;,F‚,G) ; 
CUPSASEt 1. N; 
keuze = set of cursus; 


Iedere cursist heeft zich ingeschreven voor één of meer cursussen. 
Deze gegevens zijn vastgelegd in: 


var inschrijving: arraylcursist] of keuze; 


Er moet nu een eursusrooster samengesteld worden dat zodanig is 
dat alle cursisten alle cursussen van hun keuze kunnen volgen 
(voor geen enkele cursist mogen twee of meer cursussen uit de 
keuze samenvallen). Twee cursussen kunnen dus niet gelijktijdig 
gegeven worden als er ten minste één cursist is die zich voor beide 
cursussen heeft opgegeven. Gevraagd wordt een cursusrooster dat 
zoveel mogelijk gelijktijdige cursussen bevat. 

We gaan eerst na welke cursussen niet gelijktijdig gegeven mogen 
worden. Daartoe introduceren we: 


var conflict: arraylcursus]l of set of cursus; 


conflict[k] krijgt als waarde de verzameling van alle cursussen die 
niet gelijktijdig met cursus k gegeven kunnen worden; deze verza- 
meling zal bovendien k zelf bevatten. 


Fot CA to G de 


begin conflict[c] := [c]; 
er 8 te 1 to N do 
if (c in inschrijvingls]) 
then conflict[c] := conflict[c] + inschrijvingls] 


end 
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Cursussen die gelijktijdig gegeven mogen worden noemen we een 
pakket. Het cursusrooster bestaat dan uit een aantal pakketten. 
Het maximale aantal pakketten is 7 (elk pakket bestaat uit één cur- 
sus). We introduceren: 


var rooster: arrayl1..7] of set of cursus; 
pakket: set of cursus; 
rest: set of cursus; 
Ks Ong 


Nu het algoritme voor het vinden van het rooster. De invariant is: 


Er zijn k pakketten opgenomen in rooster[1..k]; rest heeft 
als waarde de nog niet in rooster opgenomen cursussen. 


for k := 1 to 7 do roosterlk] := [ |; 
k := 0; rest := ta..cls 
{invariant} 
while rest <> [ ] do 
begin 'geef pakket goede waarde; 
k := k+1; roosterlk] := pakket; 
rest := rest - pakket 
end 


Om een pakket een waarde te geven, kunnen we een willekeurige 
cursus uit rest kiezen. Andere cursussen die in aanmerking komen 
voor dit pakket zijn de cursussen uit rest die niet in conflict zijn 
met de eerst gekozen cursus en ook niet in conflict zijn met elkaar. 
We introduceren: 


var kandidaten: set of cursus; 


en kunnen dan voor het geven van een waarde aan pakket nemen: 


kandidaten := rest; pakket := [ 1; 
while kandidaten <> [ ] do 


begin m := A; 
while not (m in kandidaten) do m := succ (m) ; 
pakket := pakket + [m]; 
kandidaten := kandidaten ~ conflict[m] 
end ° 
Voorbeeld 3 


Een landkaart met n landen (n 2 1) moet zodanig worden gekleurd 
dat aan elkaar grenzende landen verschillende kleuren krijgen. Dit 
kan gebeuren door elk land een eigen kleur te geven. Er wordt 
echter gevraagd zo min mogelijk verschillende kleuren te gebruiken. 
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Van elk land zijn door een waarde van het type 


type landgeg = record landid: 1..n; 
grensl: set of 1..n 
end 


het nummer van het land en de verzameling van aangrenzende landen 
gegeven in: 


var invoer: sequence(landgeg); 


De gegevens in invoer zijn een juiste weergave van de landkaart, 
dat wil zeggen: 


- elke landidentificatie is uniek; 
- geen enkel land grenst aan zichzelf; 
- als land A grenst aan land B, grenst land B ook aan land A. 


Het gevonden kleurpatroon moet worden toegekend aan de variabele 
uitvoer: 


var uitvoer: sequence(record landid: 1..n; 
kleur: 1..4 
end) 


Het is bekend dat voor elke landkaart het maximale aantal benodigde 
kleuren 4 is. 

We kunnen het algemene schema van backtracking gebruiken om 
een oplossing te vinden. Bij dit algemene schema wordt van alle 
toegestane kleuringen, die tot op een bepaald moment gegenereerd 
zijn, er één vastgehouden met het minimale aantal kleuren tot op dat 
moment. We zullen het algemene schema iets aanpassen: 


ak := 0; gevonden := false; 
{inv.: gevonden = 'er is een kleuring van de n landen 
met ak kleuren'} 
while not gevonden do 
begin . ak := ak+1; 
'zoek een kleuring van de n landen met ak kleuren 
met behulp van het algemene schema voor backtracking 
en leg het resultaat van de zoekactie vast in de 
variabele gevonden" 
end 


Voor het toepassen van het schema voeren we in de variabelen: 


ONE TE Toen) 
kl: arrayl1..nl of 0..4; 
geoorloofd: boolean; 
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De landen 1 tot en met i-1 hebben de kleuren kl[1], kl[2], ..., 
kl[i-1] en buurlanden hebben verschillende kleuren (deze componen- 
ten van kl hebben een waarde uit 1..4). De boolean geoorloofd 
geeft aan of de kleuring van land i met kleur kl[i] leidt tot een 
kleuring waarbij buurlanden verschillend van kleur zijn. We krijgen 
nu: 


ak := 0; gevonden := false; 
while not gevonden do 
begin ak := ak+1; 
i:= 1; kl[i] := 1; laatste := false; {backtracking invariant} 
while (not gevonden) and (not laatste) do 
begin geoorloofd := "(i,kllil) is toegestaan'; 
if geoorloofd 
khen bhogan if keen 
then gevonden := true 
else begin 'leg kleuring vast'; 
i e= ied; kllil := 1 


end 
end | 
else begin while (klli] = ak) and (i > 1) do 
begin i := i=l; 
‘ontkleur land i' 
end; 
if kl[i] = ak 
then laatste := true 
else kl[i] := kl[il]+1 
end 


end 
{backtracking invariant A (gevonden v laatste); 
als laatste dan is er geen kleuring mogelijk met ak 
kleuren} 
end 


Voor het bepalen of het toegestaan is land i te kleuren met kleur 
kl[i] moet nagegaan worden of een van de buurlanden van i al met 
kl[i] gekleurd is. Stel dat in de variabele 


var lk: arrayl1..4] of set of 1..n; 


wordt vastgelegd de afbeelding van de (tot nu toe gebruikte) kleu- 
ren op de verzameling (tot nu toe gekleurde) landen, 
en in de variabele 


var bl: arrayll..nl of set of 1..n 


de afbeelding van landen op buurlanden, dan kan de toekenning aan 
geoorloofd geschreven worden als: 
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geoorloofd := (bl[i] » Ik[kl[i]] =[ ]) 


Het vastleggen van de kleuring houdt nu in dat land i moet worden 
opgenomen in de variabele Ik: 


Ik[kllil] := Ik[kllil] + [i] 


Het ontkleuren van land i houdt in dat land i uit de verzameling 
Ik[kl[i]] verwijderd moet worden: 


Iklkllil]l 4 Ik[kllil] - [il] 


Daarmee hebben we het totale algoritme gevonden, afgezien van het 


halen van de gegevens uit invoer en het plaatsen van het resultaat 
in uitvoer. 


var j,ak: 1..4; 
ete kt O..n; 
g: landgeg; 
o: record landid: 1..n; kleur: 1..4 end; 
gevonden,geoorloofd: boolean; 
bl: array[1..n] of set of 1,‚n; 
kl: array[0..n] of 0,.4; 
lk: arrayl1..4] of set of 1, .n; 
begin for j := 1 to n do 
begin GetFirst(invoer,g); 
bl[g.landid] := g.grensl 
end; 
ak := 0; gevonden := false; 
while not gevonden do 
begin for j := 1 to 4 do Ik[j] := [ ]; 
ak := ak+1; 
i s= 1; kl[1] := 1; laatste := false; 
while (not gevonden) and (not laatste) do 
begin geoorloofd := (bl[i] » Ik[kl[il] =[ ]); 
if geoorloofd 
then begin if i= n 
then gevonden := true; 
else begin 1lk[kl[i]] := 
A AET Ik[klli]] + [il]; 
i := i+1; kl[i] := 1 


end 
end 


else begin while (kl[i] = ak) and (i > 1) do 
begin i := i-l; 
Ik[klli]] := 
lk[k1[i]] - [i] 


end; 
if kl[i] = ak 
“then laatste := true 
else kl[i] := kllil+1 
end 
end 
ed 
for j := 1 to n do 
begin o.landid := j; o.kleur := kllj]; 
Putlast(output,o) 
end 
end ep 
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In de drie voorbeelden is van sets gebruik gemaakt op een manier 
die in Pascal mogelijk is. Dit betekent dat we, bijvoorbeeld wat de 
efficiëntie betreft, afhankelijk zijn van de bij het Pascalsysteem 
gekozen implementatie van sets. Wellicht kan een eigen implementatie 
beter zijn. Bovendien zijn er talen waarin de setstructuur niet voor- 
komt. Daarom zullen we in 8.4 naar mogelijke implementaties kijken. 
Deze implementaties zullen voor onze voorbeelden in elk geval moeten 
passen bij de definitie : 


definition setstructurel; 

structure set(type t); 

function union(a,b: set(t)): set(t); 
{pre: a=a' Ab=b! 
post: union(a,b) =a' U b'} 

function intersection(a,b: set(t)): set(t); 
pre: a=a' Ab=b' 
post: intersection(a,b) = a' N b'} 

function difference(a,b: set(t)): set(t); 
pre: ara! Ab=b' 
post: differencela,b) = hemd, 


8.3 DE SET ALS SAMENGESTELD TYPE 


In dit geval kunnen waarden van het basistype toegevoegd worden 
aan of verwijderd worden uit een set. Als selectie-operatie kiezen 
we 


{v # Ø} 
any(v) 
{ (Ee: e € v: any(v) = e)} 


Een speciaal geval van any is de selectie-operatie min: 


{v # ø} 
min(v) 
{min(v) = (MINx: x € v: x)} 


Zo ook kan max(v) gedefinieerd worden. Het toevoegen en verwijde- 
ren van een element zouden we kunnen schrijven als: 


insert (v,x) 
delete(v,x) 
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die equivalent zijn met v := v + [x] respectievelijk v := v - [x]. 
Omgekeerd kunnen operaties als doorsnede, vereniging en verschil 
uitgedrukt worden in de zojuist geïntroduceerde operaties. We zul- 
len deze operaties als functies schrijven, waarbij we uitgaan van 
het bestaan van het type 


type P = set(basistype); 


De notatie zal Pascal-achtig zijn. 


function doorsnede(a,b: P): P 
var. ed: Pf 
Sd basistype; 
begin ec := f |; d := b; 
Ciner de (Dnd) ANa} 
while d <> [ ] do 
begin x := any(d); delete(d,x); 
if x E€ a then insert(c,x) 
end; 
doorsnede := c 
end; 
function vereniging(a,b: P): P 
var Car: Py 
RR basistype; 
begin C := ä; d = b; 
Er a = ie b} 
while d < [] d 
begin x := HEU delete(d,x); insert(c,‚x) end; 
vereniging := C 


end; 
function verschil(a,b: P): P 
var Cr: P) 
x: basistype; 
begin c := a; d := b; 


inv. eds a sb} 
while d <> [ ] do 

begin x := any(d); delete(d,x); delete(c,x) end; 
verschil := c 


end 


We kunnen ook een functie isempty maken, of bijvoorbeeld: 


function card(a: P): integer; 
pre: true 
post: card(a) = lal} 
var C: Pi 
x: basistype; 
m: integer; 


216 Voortgezet programmeren 


begin c := a; m := 0; 

{inv.: m = card(aNc)} 

while c <> [ | do 
begin x := any(c); delete(ec,x); m := m+1 end; 
card := m 


end 


In de functies komen lokale variabelen voor van het type P, die 
veelal geïnitialiseerd worden met de waarde van een parameter van 
het type P. Omdat de parameters by value zijn zouden deze lokale 
variabelen achterwege kunnen blijven. 


Een eerste voorbeeld van het gebruik van de set als samengesteld 
type hebben we al eerder gezien: de zeef van Eratosthenes. Nu nog 
twee andere voorbeelden. 


Voorbeeld 4 
Gegeven jar een verzameling V en m deelverzamelingen Di van V 
(i = 1,2,3,...,m). Gevraagd wordt uit elke Di een element aj te 


kiezen (aj noemen we de representant van Di) zodanig dat ai # aj 
(ai € Di, aj € Dy) als i £ j. 

Dit aha heeft niet altijd een oplossing. Als het probleem een 
oplossing heeft, kan deze (onder bepaalde voorwaarden) op de vol- 
gende wijze gevonden worden. Zoek onder de verzamelingen Di, 
waarvoor nog geen representant is gevonden, de verzameling met 
het kleinste aantal elementen. Kies van deze verzameling een 
willekeurig element als representant en verwijder dit element uit de 
andere Di. 

De deelverzamelingen Di zijn vastgelegd in: 


var D: arrayl1..ml of set(1..n); 


De oplossing wordt vastgelegd in: 


var representatie: arrayl1..ml of 1..n; 


In het algoritme is het nodig om te weten welke elementen van 
representatie nog geen waarde hebben. Daarom introduceren we: 


var zonder: set(l..m); 


Als j € zonder dan is representatiel jl ongedefinieerd. 
Als in het boven beschreven proces ten minste één van de (over- 


gebleven) Di leeg is, is er geen oplossing. Vandaar dat we nog 
gebruik maken van: 


var leeg: boolean; 
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De invariant voor het algoritme is: 


(Ai: i ¢ zonder: representatieli] is gedefinieerd) A 
leeg = (Ei: i € zonder: D[i] = [ ]) 


Het algoritme luidt dan: 


zonder ¿= [1..mly leeg := false; i := 1; 
while (i <= m) and not leeg do 
begin leeg := (D[il = [ 1); i := i+1 end; 
{invariant } 
while (not leeg) and (zonder <> [ ]) do 
begin {zoek in de overgebleven Di de verzameling met het 
kleinste aantal elementen} 
hulp := zonder; 
h := any(hulp); delete(hulp,h); 
min := card(D[h]l); i := h; 
{min = (MINj : j € zonder\hulp: card(D[j]) = D[i]} 
while hulp <> [ ] do 
begin h := any (hulp); delete(hulp,h); 
if card(D[h]) < min 
then begin min := card(D[h]); i :=h end 


end; 
r s= any(D[il); {r is representant van Di} 
representatielil := r; delete(zonder, i); 
{r uit de overgebleven Di verwijderen: } 
hulp := zonder; 
while hulp <> [ ] do 

begin h := any(hulp); delete(hulp,h); 

delete(D[h],r) 


end; 
{nagaan of er nu een lege Dj is:} 
leeg := false; hulp := zonder; 
while (hulp <> [ |) and (not leeg) do 
~ begin h := any (hulp); delete (hulp,h); 
leeg := (Dfh] = {[-]) 
end 
end ? 


Voorbeeld 5 
De variabele a, vastgelegd door 


type punt = 1..n; 
var a: array[punt,punt] of boolean; 


heeft een waarde. 
We noemen een punt j (j € {1,2,...,n}) direct bereikbaar vanuit 
punt i als geldt a[i,j ] = true. We noemen punt j bereikbaar vanuit 
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punt i als j direct bereikbaar is vanuit i of als er punten p1,p2,. 
‚Pk (k 2 1) zijn waarvoor geldt 


ali,p]] =alp‚;Pgl = -…. = alPk-1Pk] = alP‚ sil = true. 


De waarde van a is zodanig dat geen enkel punt bereikbaar is van- 
uit zichzelf. 

Gevraagd wordt een algoritme dat bij een gegeven punt p de ver- 
zameling genereert van alle vanuit p bereikbare punten. 

Voor de beschrijving van het algoritme introduceren we het 
begrip afstand, d(p,q), tussen punten: 


- d(p,q)= 1als q direct bereikbaar is vanuit p; 
- d(p,‚q) =k+1 als q via k punten bereikbaar is; als q via k en via 4 
punten bereikbaar is vanuit p dan geldt: d(p,q) = min(k,2) +1. 


Als eerste aanzet tot het algoritme kunnen we geven: 


sard- f) 


1 ton do if àlp;3] then insert(s,i); 


begin x := y; y := [ ]; k := k+1; 
for All 1 E x 00 
or j € [t..nl-s do 
Iz if ali,j] then begin insert(s,j); 
insert(y,j) 
end 
end DE 


De variabele k speelt in het algoritme geen enkele rol (en kan als 
ghost-variabele beschouwd worden), De waarde van [l..n]-s kan 
in een variabele vastgelegd worden. Als de for-statements niet 
mogelijk zijn, kunnen de repetities gerealiseerd worden met behulp 
van extra setvariabelen en any- en delete-opdrachten. In het 
onderstaande algoritme is een deel van deze aanpassingen aange- 
bracht. 


=l }; 


1 ton do if alp,il then insert(s,i); 


while y <> [ ] do 
begin x := y; y := [ 
ve Midile k > [ ] 
begin i := (x); delete(x,i); 

for j := 1 ton do 


Í; 
do 
an 
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if ali,jl then begin insert(y,j); 
insert(s,j) 

end 

end P 
ooo 8 


Implementaties voor de set als samengesteld type moeten passen bij 
de definitie: 


definition setstructure2; 
structure set(type t); 
function any(s: set(t)): t; 
s # g 
post: any(s) € s} 
procedure insert(var s: set(t); i: t); 
(pre: s = x 
poste s= x U {i}} 
procedure delete(var s: set(t); i: t); 
pre: s = X 
post: s = «N{i}} 
procedure empty(var s: set(t)); 
pre: true i e 
post: s = Ø} 
function isempty(s: set(t)): boolean; 
pre: s =x 
post: isempty(s) @ (x = Ø)} 


end 


We hebben hier de operaties insert en delete als procedure gedefi- 
nieerd. Daardoor kunnen alleen waardeveranderingen gerealiseerd 
worden, en niet creatie van nieuwe waarden; met andere woorden 
alleen operaties als 's1 := sl U {i} en niet als 's2 := s1 U{i}. Indien 
we ook deze laatste soort willen gebruiken, zou insert als functie 
gedefinieerd moeten worden met bijvoorbeeld als definitie: 


function insert(s: set(t); i: t): set(t); 
pre: s = X 
pôst: s =x Alinsert(s/ijc= x U {i}} 


De operatie insert als functie is algemener; als procedure is de 
implementatie over het algemeen efficiënter. 
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8.4 IMPLEMENTEREN VAN SETTYPEN EN 
SETSTRUCTUREN 


8.4.1 Inleiding 


Voor sets is een groot aantal mogelijke implementaties bekend. Als 
er in een algoritme voor een implementatie moet worden gekozen, 
kunnen als criteria genomen worden: 


- de kardinaliteit van de waardenverzameling van het settype (2N); 
- de kardinaliteiten van de waarden van het settype waarmee in 
het algoritme gemanipuleerd wordt (2 0, < 2N); 
- de kardinaliteit van de waardenverzameling van het basistype (N); 
- de efficiëntie van de operaties die in het algoritme op sets moeten 
worden uitgevoerd. 
- combinaties van deze criteria. 


We zullen een aantal implementaties bekijken waarbij we aan de 
genoemde criteria aandacht zullen besteden. De implementaties die 
worden bekeken, worden gerealiseerd met behulp van: bit-arrays, 
(gesorteerde) sequences en kettingen, binaire (zoek)bomen, arrays 
(op een aantal manieren), heaps en hashtabellen. 

Speciale sets zijn de zogenaamde dictionaries en priority queues. 
Een dictionary is een set met de operaties insert en delete. Een 
speciale implementatie gaat met behulp van hashing. Maar ook 
andere implementatiemogelijkheden kunnen gebruikt worden. 

Een priority queue is een set met de operaties insert en deletemin 
(een combinatie van de operaties min en delete, dus het verwijde- 
ren van het kleinste element). Een speciale implementatie voor 
priority queues gaat met behulp van heaps. Ook andere implementa- 
ties kunnen gebruikt worden. 

Een speciale klasse van algoritmen die werken met sets is de 
klasse van zogenaamde union-find algoritmen. Dit zijn algoritmen 
waarbij op sets als operaties worden uitgevoerd: union (van dis- 
juncte verzamelingen) en find (vind de verzameling waar x ele- 
ment van is met ook disjunctie van verzamelingen). Een implementa- 
tie kan met behulp van binaire zoekbomen, maar ook andere imple- 
mentaties zijn mogelijk. 

In sommige gevallen zullen we de setstructuur implementeren, in 
andere gevallen zullen we een settype implementeren. Bij het imple- 
menteren van het settype zal het basistype steeds het type 1..n 
zijn, tenzij er speciale redenen zijn om hiervan af te wijken. Een 
reden zou kunnen zijn dat de implementatie geschikt is voor een 
speciaal basistype, maar niet in het algemeen. Als de waardenver- 
zameling van het basistype bekend is, kunnen we via een tabel 
natuurlijk altijd uitkomen bij het type 1..n, alleen moet dan steeds 
via de tabel gewerkt worden. 
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8.4.2 Bit-arrays 


Als de kardinaliteit van het basistype klein is, kan een set efficiënt 
(in ieder geval wat de snelheid van de operaties betreft) geïmple- 
menteerd worden met behulp van een bit-array (ook wel bitstring 
of bitvector genoemd). 

We gaan uit van: 


type set = arraylbasistypel of boolean; 


als implementatie van de waardenverzameling van het type 
set (basistype); 


(In Pascal zouden we, om 'ruimte' te besparen, een packed array 
kunnen gebruiken.) 
De abstractiefunctie A: set > set(basistype) definiëren we als: 


Alb) ={i € basistype | bli} 


voor alle b € set (voor alle mogelijke waarden van het type set; 
b is de naam van een variabele van het type set). Neem bijvoor- 
beeld voor het basistype het type (rood,geel,groen). Elke setwaarde 
wordt dan voorgesteld door het drietal (b[rood],b[geel],b[groen]). 
De hoeveelheid benodigde ruimte voor de representatie van elke 
setwaarde is: kardinaliteit van het basistype * benodigde ruimte 
voor een boolean waarde. Deze hoeveelheid ruimte is onafhankelijk 
van de waarde zelf. Dit betekent dat, als de setwaarden waarmee in 
een algoritme gewerkt wordt weinig elementen bevatten, deze imple- 
mentatie onvoordelig is. Vandaar ook dat deze implementatie beperkt 
wordt tot die gevallen waarin het basistype een kleine kardinaliteit 
heeft. Een groot voordeel van deze implementatie is dat operaties 
zoals insert, delete en el in constante tijd gerealiseerd worden. 
Als implementatie voor het settype, als samengesteld type, met 1..n 
als basistype krijgen we dan: 


implementation settype2; 
type set = array[1..n] of boolean; 
{abstractiefunctie voor s van het type set: 
Als) := 1 € [lend | s[x]}} 
function any(s: set): 1. .n; 
{pre: Als) # Ø 
post: any(s) € Als) } 
var i: 1..n; 
begin {A(s) # Ø} 


diel 

(Aja 1 j < Aramsiohy 
while not s[i] do is Iri 
any := i 


end; 
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procedure insert (var TI Cr Or Are 
{pre: Als) = x 
post: -A{s). = Ui} 
begin sli] := true end; 
procedure delete(var s: set; is J:n); 
{pre: Als) = x 
posts Ma) KA TEEN 
begin sli] := false end; 
function el(s: set; i: 1..n): boolean; 
{pre: Als) = x; 
post: el (syi).=. (4,6 )} 
begin el := s[i] end; 
procedure empty(var s: set); 
{pre: true 
post: A(s) = Y} 
var ds lan 


begin for i := 1 ton do sli] := false end; 
function isempty(s: set): boolean; 
{pre: Als) =X 


post: isempty(x) = (x = 7) } 
vår 1ekkeldf 


begin i := 1; 
CAR sake dtm shalt} 
while- (i < ñ) ând not:s[i] do i =. i+i; 
isempty := notik ge 

end 


end 


Operaties als doorsnede, vereniging en verschil vragen een tijd die 
evenredig is met de kardinaliteit van het basistype. Voor de set als 
enkelvoudig type kunnen we als implementatie nemen: 


implementation settypel; 
type set = arrayl1..nl of boolean; 
{abstractiefunctie voor s van het type set: 
Als) = {x € [1..n} | s[xJ3} 
function union(a,b: set): set; 
var is: 1..n; 


C: Set; 
begin for i := 1 ton do clil :=alil or blil; 
union := C 


end; 
function intersection(a,b: set): set; 
VAR KT Ect 


Cc: set; 
begin for i := 1 ton do clil := a[i] and blil; 
intersection := c 


end; 
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function difference(a,b: set): set; 

We i: L.D)? 

HES Cs Set; 

begin for i := 1 ton do cli] := a[i] and not bli]; 
difference := c 


end; 
DEI el... r 
ERGE ISNIC ee es eee ; 
procedure empty ........ 7 
function singleton(i: 1..n): set; 
{pre: true 


post: A(lsingleton(i)) = {i}} 
var Je f..n; 
es Bets 
begin for j := 1 ton do cli] := false; 
cli] := true Pe 
end; 


end; 


We hebben hier bij de eerder gedefinieerde operaties de pre- en 
postcondities weggelaten. 

Ook het vaststellen of a een deelverzameling is van b is eenvou- 
dig als operatie op te nemen bij deze implementatie: 


deel := true; i 
{deel = (Aj: 
while (i <> n 

begin i := it1; deel := not ali] or bli] end 


Ne e 
W 

æ . 
e AR U 


Een deelverzameling als b = {i €a | P(i)} kan gegenereerd worden 
door: 


for i := 1 ton do bli] := ali] and P(i) 


De implementaties zijn erg eenvoudig als het basistype als indextype 
voor arrays gebruikt mag worden. Is dit niet het geval, dan zou 
met een tabel een afbeelding van het betreffende type op een inter- 
val van integers gemaakt kunnen worden. 

Grote efficiëntie wordt bereikt voor operaties als doorsnede en 
vereniging als er and- en or-operaties beschikbaar zijn voor hele 
arrays, zoals die er ook zijn voor machinewoorden in sommige 
machinetalen. Juist vanwege de beschikbaarheid van deze operaties 
in sommige machinetalen, wordt bij het gebruik van sets in Pascal 
vaak een bovengrens opgegeven voor de kardinaliteit van het basis- 
type (kennelijk worden sets dan via bitvectoren geïmplementeerd). 
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8.4.3 Sequences 


Als in een taal de setstructuur niet aanwezig is, maar wel de 
sequencestructuur (eventueel als abstracte datastructuur), kunnen 
we de setstructuur implementeren met behulp van de sequence- 
structuur. Als abstractiefunctie nemen we 


A(( ))=9 
A(s ~ (e)) = A(s) U te} 


Als representatie-invariant nemen we dat alle elementen van de 
sequence verschillend zijn. We zouden hieraan kunnen toevoegen 
dat de sequence in stijgende volgorde gesorteerd is. Als we deze 
eigenschap aangeven met S dan geldt 


S(( )) = true 
S((e) ~ s)=(e= (MINX : x € Alle) »s):x)) 


Deze eigenschap S zullen we eisen voor de implementatie als de ope- 
raties hierdoor efficiënter zijn te realiseren. 

Een voordeel van de implementatie met behulp van een sequence 
is dat de benodigde ruimte alleen afhangt van de kardinaliteit van 
de waarden waarmee gemanipuleerd wordt in algoritmen en niet bij- 
voorbeeld van de kardinaliteit van het basistype. 

We bekijken de implementatie voor de set als enkelvoudig type 
(met de eigenschappen S en V (alle elementen van de sequence zijn 
verschillend)): 


implementation setstructurel; 
structure set(type t) = sequence(t); 
function union(a,b: set(t)): set(t); 
{pre: Ala) =x A Alb) = y A S(a) A S(b) A Vla) A V(b) 
post: A(union(a,b)) = x U y 
AS(union(a,b)) A V(union(a,b))} 
Ee RE Ey 
BRE set(t); 
begin CreateSeq(c); 
{inv.: Alc) = (xa) U (yb) 
ASDIC) A MLC) 
AAA GE ALCI a BIS (MINE s £ B Ala): £)) 
(Ae: e € Alc) :e < (MINE: f E A(b) : £))} 
while not SeqIsMT(a) and not SeqIsMT(b) do 
begin i := First(a); j := First(b); ET 
d£ ijs j 
then begin GetFirst(a,i); 
PutLast(c,i) 


end 
else af i e. 
then begin GetFirst(b,j); 
PutLast(c, j) 


end 
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else begin GetFirst(a,i); 
GetFirst(b,j); 
PutLast(c,j) 
end 
end; 
while not seqIsMT(a) do 
begin GetFirst(a,i); PutLast(c,i) end; 
while not SeqIsMT(b) do 
begin i GetFirst(b,j); PutLast(c,‚j) end; 
union := c 


end; 
function intersection(a,b: set(t)): set(t); 
{analoog aan union} 
function difference(a,b: set(t)): set(t); 
analoog aan union} 
function el(s: set(t); i: t): boolean; 
pre: A(s) =x A S(s) A V(s) 
post: el(s,i) = i € A(s)} 
var b: boolean; 


Ae ty 
begin b := false 
{inv.: b = (i komt voor in het geselecteerde 


deel van s)} 
while not SeqIsMT(s) and not b do 
begin « GetFirst(s, j); 
b s= (Ì = j) 


end; 
el := b 
end; 
function isempty(s: set(t)): boolean; 
begin isempty := SeqIsMT(s) end; 
procedure empty(var s: Bette); n 
begin CreateSeg(s) end; 
function singleton (i: t): set(t); 
pres true 
post: Alsingleton(i)) = {i}} 
var s: set(t); 
begin CreateSegq(s); 
PutFirst(s,i) 
end 


end 


We hebben niet steeds de A, de S, de V en de pre- en postcondities 
vermeld. 

Een groot voordeel van de gegeven implementatie is dat de ruimte 
die nodig is voor een waarde, onafhankelijk is van de kardinaliteit 
van het basistype. maar alleen afhankelijk is van de kardinaliteit van 
de waarde zelf. Operaties als doorsnede, vereniging en verschil 
vragen een tijd die evenredig is met de som van de aantallen elemen- 
ten van de argumenten. 
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Wé hebben gesorteerde sequences genomen, er daarbij van uit- 
gaande dat het basistype t geordend is. 


8.4.4 Kettingen 


We hebben zojuist gezien dat sets geïmplementeerd kunnen worden 
met sequences. Al eerder zagen we dat sequences geïmplementeerd 
kunnen worden met kettingen. En dus kunnen we sets implemente- 
ren met kettingen. Een directe implementatie van sets met kettingen, 
die dus niet via sequences verloopt, zou echter om een of andere 
reden best beter (efficiënter) kunnen zijn. Dit geldt in het algemeen 
voor allerlei structuren die in elkaar uitgedrukt kunnen worden. 
Een voorbeeld bij kettingen en sequences vinden we in de union- 
find algoritmen (zie opgave 8.5.3). De vereniging is dan heel erg 
eenvoudig te realiseren met kettingen: laat het laatste element van 
de ene ketting wijzen naar het eerste element van de andere ketting. 
Deze vereniging realiseren met sequences vraagt veel meer tijd. 


Opmerking 


Een eenvoudige implementatie van sets voor union-find algoritmen 
wordt gevonden door voor het totaal aan sets te kiezen: 


arraylbasistypel of 'namen van de sets' s 


8.4.5 Arrays 


In hoofdstuk 6 hebben we de implementatie gezien van sets met 
behulp van een record bestaande uit een (ongesorteerd) array en 
een variabele die het aantal elementen van de set aangeeft. Deze 
implementatie is zeker niet efficiënt in ruimte als de setwaarden erg 
variëren in kardinaliteit. Ook de realisaties van de operaties insert 
en delete zijn niet erg efficiënt. Ditzelfde geldt voor operaties als 
doorsnede en vereniging (tenzij het bij de vereniging gaat om dis- 
junctie verzamelingen, zoals in union-find algoritmen). De efficiëntie 
van de implementatie van sets met arrays kan verbeterd worden 
door de arrays gesorteerd te houden. De linear search uit de 
insert en delete kan dan vervangen worden door de binary search. 
En de algoritmen voor operaties als doorsnede en vereniging worden 
lineair in plaats van kwadratisch. De abstractiefunctie is dezelfde 
als bij het ongesorteerde array. Het gesorteerd zijn van het array 
moet als representatie-invariant worden opgenomen. Voor de door- 
snede krijgen we bijvoorbeeld als algoritme (a, b en c zijn arrays; 
Ale) := Ala) N A(b)): 
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{a[0..m1-1] en b[O..m2-1] hebben een waarde} 

Jem Q} j ts Ork eo 0; 

{inv.: (de gelijke onder a[0..i-1] en b[0..j-1] staan 
gesorteerd in c[0..k-1]) a a[i] > b[j-1] A 
blj] > ali-1}} 

while (i <> ml) and (j <> m2) do 

begin if alil = b[j] 

~ then begin c[k] := ali]; 
dem itip j em j+; k :sck+l 


end 
else if ali] < b[j] 
~ then i := i+1 
else j := j+1 
end 
{e[O..k-1] = tald. .mi-i]:N b[O..m2-11'} 


De ml en m2 zijn de bovengrenzen voor de arrays a respectievelijk 
b. In het bovenstaande is geen rekening gehouden met het feit dat 


array c ook beperkt is in lengte. De beperking in lengte zou opge- 
nomen moeten worden in de representatie-invariant. 


8.4.6 Binaire bomen en heaps 


De binaire zoekboom (zie hoofdstuk 5) levert een goede mogelijkheid 
voor het implementeren van sets. We gaan uit van het type 


type knoop = record w: t; l,r: fknoop end; 


In de implementatie krijgen we dan voor de setstructuur: 


structure set(t) = tknoop; 


Als abstractiefunctie BV nemen we 


BV (nil) =Ø 
BV(p) = BV(p+4.1) U{pt.w} U BV(pt.r) 


De eigenschap dat de binaire boom een zoekboom is zullen we, waar 
dat in het onderstaande van toepassing is, aangeven met BZ: 


BZ(nil) = true 
BZ(p) = BZ(pt.1) A BZ(pt.r) a (Ak: k € BV(pt.l1):k < pt.w) 
A (Ak:k € BV(Pptr): k > pt.w) 


De benodigde ruimte is alleen afhankelijk van de actuele setwaarden 
in de algoritmen. 

De binaire zoekboom is zeer geschikt voor de implementatie van 
sets met de operaties insert en el. De overeenkomstige operaties 


228 Voortgezet programmeren 


voor de binaire zoekbomen zijn bij de behandeling van deze bomen 
aan de orde geweest. Ook hebben we toen gekeken naar het geba- 
lanceerd zijn van een binaire boom. Voor de realisatie van de opera- 
tie el is dit een prettige eigenschap in verband met efficiëntie. De 
realisatie van de operatie delete kost iets meer moeite dan de reali- 
satie van de andere operaties. Voor het algoritme geldt: 


- als het te verwijderen element een blad is (twee lege subbomen 
heeft), dan kan het zonder meer worden weggelaten; 

- als het te verwijderen element één lege subboom heeft, dan kan 
het element worden verwijderd en de wortel van de niet-lege 
subboom neemt de plaats in van het verwijderde knooppunt. 


Voorbeeld Verwijdering van b 


- als het te verwijderen element twee subbomen heeft dan kunnen 
we de eigenschap BZ behouden als we op de plaats van het ver- 
wijderde element de grootste waarde van de linker subboom of de 
kleinste waarde uit de rechter subboom plaatsen. In de onder- 
staande figuur is de kleinste waarde uit de rechter subboom 
genomen; ook in het algoritme zal de kleinste uit de rechter sub- 
boom genomen worden. We moeten er steeds aan denken dat na het 
omwisselen van de waarden eigenschap BZ hersteld moet worden 
voor de subboom waar we de waarde van hebben weggenomen. 


Voorbeeld Verwijdering van de waarde 10 


13 
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De realisatie van de delete-operatie wordt: 


procedure delete(var s: set(t); i: t); 
pre: BV(s) = x A BZ(s) 
‘post: BV(s) = x N {i} A BZ(s)} 
var p: set(t); 
ms ts 
begin if s <> nil 
then begin if i < st.w 
then delete(st.l,i) 
else if i > stew 
then delete(st.r,i) 
else if (st‚l = nil) and (st.r = nil) 
then begin dispose(s); s := nil end 
else if st‚l ='nil TASAR 
then begin p := s; 
s := st.r; 
dispose(p) 


end 
else if st.r = nil 
then begin p := s; 
S: ie stil? 
dispose(p) 
end 


else begin AR gtir) 
removemin (p,m); 
st.w := m 
end 
end ne 
gnd 


We hebben gebruik gemaakt van een procedure removemin, die we in 
de structuur-implementatie zullen moeten opnemen. Deze procedure 
luidt: 


procedure removemin(var b: set(t); var m: t); 
{pre: BV(b) = x A BZ(b) Ax % WY 
post: BV(b) = xN {m} A BZ(b) A m= (MINe:eEx:e)} 
var h: set(t); et: 
begin if bA.l = nil 
“then begin m := bt.w; h := b; 
b := bt.r; dispose(h) 
end 
else removemin (Otit, m) 
end 


We bekijken nu een ander soort binaire boom en wel de zogenaamde 
partieel geordende binaire boom. Een binaire boom is partieel geor- 
dend als de wortel van elke boom ten hoogste gelijk is aan de wor- 
tels van de linker en rechter subboom (als deze subbomen niet leeg 
zijn). De wortel van de totale binaire boom is dan de kleinste waarde 
in de boom. We gaan zo'n partieel geordende boom implementeren 
met behulp van een array. 
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var b: arrayl1..nl of basistype; 
aantal: 0. .n; 


b[1] is de wortel van de binaire boom. Het aantal knooppunten is 
aantal. Als b[i] een knooppunt is (1 si < aantal), dan zijn, als de 
linker en rechter subboom niet leeg zijn, b[2+i] en b[2xi+1] de wor- 
tels van deze linker respectievelijk rechter subboom (de subbomen 
zijn niet leeg als 1 < 2*i < aantal, respectievelijk 1 < 2*i+1 < aantal). 
Dit is alleen te verwezenlijken als de partieel geordende binaire 
boom een bepaalde vorm heeft: tot aan het laagste niveau is de boom 
gebalanceerd, op het laagste niveau zijn de knooppunten 'links aan- 
geschoven'. Zo'n binaire boom wordt volledig genoemd. (Soms noemt 
men deze vorm van een binaire boom bijna volledig en reserveert 
men de term volledig voor het geval dat alle knooppunten tot aan 
het laagste niveau twee niet-lege subbomen hebben.) 

Het partieel geordend zijn van de binaire boom kunnen we nu 
formuleren als een eigenschap van het array: 


(Ai: 1< is aantal: (2*i < aantal = bli] < b[2#i]) A 
P (2xi+1 < aantal = b[i] < b[2*i+1])) 


Deze eigenschap van een array noemt men de heapeigenschap 
(is ook voor een deel van een array te formuleren: alp. .q] heeft de 
heap-eigenschap als: 


(Ai:p< i <q: (2i <q» ali]< al2+#]) ^ 
i (2+i+1 < q > ali] < al2*i+1})) ). 


Deze eigenschap hebben we ook al eerder geformuleerd bij sorteren. 
We vergeten nu de binaire boom en implementeren een set met . 
behulp van een array met de heap-eigenschap. De abstractiefunctie A is 


A(b[1..aantal]) ={b[1],b[2],b[3],...„blaantal] } 


voor aantal # 0 en voor aantal = 0 gaat het om de lege verzameling. 

De heap-eigenschap H gebruiken we als representatie-invariant. De 
operaties insert en deletemin kunnen eenvoudig gerealiseerd wor- 
den (de set is een priority queue). We kunnen als structuur defini- 
eren: 


definition priorityqueue; 

structure priorg(type t); 

procedure empty(var s: priorg(t)); 
{pre: true 
post: s = Ø} 

procedure insert(var s: priorq(t); x: t); 
pre: s = y Bate 
post: s'= y U {x}} 

procedure deletemin(var s: priorg(t); var x: t); 
pre: s = y 
post: s= YX Ax = (MINi:i€ y: i)} 
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function el(s: priorg(t); x: t): boolean; 
pre: s= y 
post: el(x,s) = (x € y)} 

function isempty(s: priorq(t)): boolean; 
pre: s = y 


post: isempty(s) = (y = Ø)} 
end 


Wat de implementatie betreft, kijken we alleen naar de operaties 
insert en deletemin. 


implementation priorityqueue; 
structure priorg(type t) = record b: array[0..n] of t; 
aantal: 0..n 
end; 
{Abstractiefunctie: A 
Representatie-invariant: H A b[O] is sentinel-element 


A (Ai,j: 1 S i,j S aantal A i#j:b[i] # b[j])} 
rocedure insert(var s: priorg(t); x: t); 
{pre: Als) = yY A H(s) 
post: Als) = y U {x} A H(s)} 
var h: t} 
ce r Ovale 
begin if not el(s,x) 
amet en begin s.aantal := s.aantal +1; 
s.b[s.aantal]) := x; 
{Als) = y U {x}} 
i := s.aantal; 
{inv.: H(s.b[1..i-1]) A H(s.bli..s.aantal])} 
while (i > 1) and (s.blil < s.bli div 2]) do 
begin h := s.blil; s.bli} := s.bli div 2]; 
s.bli div 2] := h; i := i div 2 
end Eik rag 
{H(s.b[1..s.aantal])} 
end 
end; 
rocedure deletemin(var s: priorq(t); var x: t); 
{pre: A(s) = y A H(s) 
post: A(s) = yN {x} A H(s) Ax = (MINi: i€ y: i)} 
var hs t; 
i,j: integer; 
g: boolean; 
begin x := s.b[1]; s.b[1] := s.bls.aantall; 
s.aantal := s.aantal - 1; 
g := true {fictief}; i := 1; 
{inv.: H(s.b[1..i]) A H(s.bli+1..s.aantal]) 
A g= (s.b[li] > s.b[2+i] v s.b[i] > s.b[2*i+1])} 
while (i <= s.aantal div 2) and g do 
begin if (s.bl2+i] < s.b[2+i+1]) or (2*i = s.aantal) 
then j := 2*i else j := 2*i+1; 
if s.blil > s.blj] 
then begin h := s.blil; s.blil : 
s.bljl := h; 
i := j 


s.bljl; 


end 
else g := false 
end 
{H(s.b[1..s.aantal])} 
end; 


end; 
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Tot nu toe is de enige soort parameter van een structuurdefinitie 
steeds een type geweest. In de bovenstaande definitie zou ook n, 
de maximale kardinaliteit van het type t (of van de actuele setwaar- 
den), als parameter meegegeven kunnen worden om de definitie 
flexibeler te maken. 


8.4.7 Hashing 


We gaan uit van de set als samengesteld type met als operaties 
empty, el, insert en delete. Stel dat we de verzameling V moeten 
implementeren. In P van V implementeren we b deelverzamelin- 
gen Vi (i= 0,1,2, ‚b-1) waarvoor geldt: 


Vavo U VUE eeN 


Vali Yy Tt voor i # j. 


b-1 


We veronderstellen dat er een functie h 
h: basistype > {0,1,2,...,b-1} 


is die deze verdeling van de elementen van V over de Vj bepaalt. 
Deze functie noemen we de hashing-functie (zie ook 3.2). We komen 
er later op terug. Voor de operaties geldt nu: 


Tied, komt overeen met el(V;,x) met i = h(x) 
- insert(v,x) komt overeen met insert(vj,x) met i= h(x) 
- delete(v,x) komt overeen met delete(Vj,x) met i= h(x) 


Voor de implementatie van de deelverzamelingen zou elk van de eer- 
der gegeven methoden gebruikt kunnen worden. Er zijn echter twee 
speciale implementatiemethoden die meestal in samenhang met de 
hashing-functie gebruikt worden: open hashing (ook wel directe 
ketening genoemd) en gesloten hashing (ook wel open adressering 
genoemd). Ook op deze methoden komen we later terug. 

De implementatie met behulp van hashing is efficiënt als b 
(b < card(V)) groot is en h zodanig is dat de kardinaliteiten van de 
deelverzamelingen Vj ongeveer allemaal even groot zijn (als 
b = card(V) en voor alle i geldt eard(Vj) = 1, dan zijn de operaties 
constant in tijd). 

Er is een groot aantal manieren bekend om bij een gegeven basis- 
type en een gegeven V een keuze te maken voor de hashing-functie 
h. Als het basistype het type integer is (of een interval hiervan) 
blijkt in de praktijk vaak de functie h(x) = x mod b goed te voldoen, 
waarbij b het grootste priemgetal is dat ten hoogste gelijk is aan 
card(V). 

Als h zodanig is dat voor alle waarden x van V h(x) dezelfde 
waarden oplevert, krijgen we de vorige implementaties terug. Als 
het aantal funetiewaarden gelijk is aan card(basistype), dan krijgen 
we een soort (inverse) bitstring-implementatie terug. 


Verzamelin gen 233 
OPEN HASHING 


De deelverzamelingen worden geïmplementeerd met behulp van 
sequences (of kettingen). Een verzameling V wordt geïmplementeerd 
als b sequences, waarbij gebruik wordt gemaakt van het type: 


arrayl0..b-1l of sequence(basistype); 


Een element x € V wordt opgenomen in de sequence behorende bij 
het array-element met index h(x). 

Het array van ‘pointers! wordt wel de hashtabel genoemd. De 
sequences worden wel buckets genoemd. 


N.B. Bij kettingen gaan we uit van het type 


type element = record w: basistype; 
p: telement 
end 


De hashtabel is dan van het type 


array[0..b-1] of telement; ® 


We zullen nu de implementatie geven, waarbij we als representatie- 
invariant B (voor alle elementen x in bucket(i), de i-de sequence, 
geldt h(x) = i) nemen. We geven direct de implementatiemodule van 
een dictionary. 


implementation dictionary; 
structure dict(type t) = array[0..b-1] of sequence(t); 
ade arie voor s van het type dict(t): 


Als) = Ti {x | x in dict[i]} } 


RE ee de daCtfE)); 
{pre: true 
post: Ald) = Ø A B(d)} 
var i: 0..b-1; 
begin for i := 0 to b-1 do CreateSeg(dlil) end; 
function el(d: dict(t); X: t): boolean; 
o Apre: Ald) = y A B(d) 
post: el(d,x) = (x € y)} 
var k: sequence(t); 
Te REDI boolean; 
G? C? 
begin k := dlh(x)l; b := false; 
while not SeqIsMT(k) sad not b do 
begin GetFirst(k, e); b := (e = x) end; 
el := b 
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procedure. Insert. saus ses F 
procedure delete ........«. $ 
fuhot ibon: isenph neiu ed se j 


end; 


Bij deze implementatie maken we gebruik van ongesorteerde sequen- 
ces. Zijn de operaties efficiënter te implementeren als we gesorteerde 
sequences gebruikt zouden hebben? En hoe zit het met de efficiëntie 
als we van (gesorteerde) kettingen gebruik zouden hebben gemaakt? 


GESLOTEN HASHING 


Alle deelverzamelingen Vi van V worden nu in één array geimplemen- 
teerd. Het componenttype van dit array is het basistype, verenigd 
met twee speciale waarden. Als het basistype bijvoorbeeld 1..n is 
dan kunnen we voor de speciale waarden -1 en -2 nemen. In de 
algoritmen zullen deze speciale waarden 'leeg' en 'weg' worden 
genoemd. De waarde 'leeg' geeft aan dat er op die plaats geen 
waarde is geplaatst via een insert-operatie. Heeft het array-element 
de waarde 'weg' dan is er een waarde geplaatst geweest, die via een 
delete-operatie daarna is verwijderd. Waarom we onderscheid maken 
tussen 'leeg' en 'weg' komt straks aan de orde. De component met 
index j, 0 < j < m-1 (we nemen een array met m componenten) repre- 
senteert Vi als voor x € Vi geldt h(x) = j. Dit kan natuurlijk alleen 
goed gaan als voor alle Vj geldt card(Vi) = 1. Als er een i is waar- 
voor geldt card(Vj) > 1 dan is het mogelijk dat we een element x van 
Vi trachten te plaatsen in de component h(x), terwijl deze component 
al de waarde y heeft met x £ y maar met h(x) = h(y). Deze situatie 
wordt botsing genoemd (collision). De x wordt dan op een andere 
plaats in het array gezet. De wijze waarop we die andere plaats 
vinden wordt de rehash-strategie genoemd. De plaatsen die gepro- 
beerd worden om x te plaatsen in het array s, inclusief de plaats 

die de hashing-functie oplevert, zou kunnen zijn: 


s[(h(x) + g(i)) mod m] voor i =0,1,2,..., 


waarin g een functie is waarvoor geldt g(0) = 0. Bekende voorbeel- 
den van functies voor g zijn g(i) = i (lineair proberen! genoemd) 
en g(i) = i? ('kwadratisch proberen! genoemd). Aangetoond moet 
wel worden dat alle mogelijke plaatsen bekeken worden. Voor lineair 
proberen is dit geen probleem. Voor kwadratisch proberen zijn er 
voorwaarden bekend waaronder dit goed gaat. We beperken ons 
verder tot lineair proberen. Als er met het proberen geen lege 
plaats is te vinden, is het array 'vol'. Dit kan veroorzaakt worden 
doordat we m te klein hebben gekozen (kleiner dan card(V)), of 
door het toepassen van delete-operaties, waardoor array-elementen 
de waarde 'weg' hebben. Laten we dit eens bekijken. Stel dat alleen 
insert-operaties worden toegepast. Als we dan bij het plaatsen van x 
een lege plaats, vanaf s[h(x)], vinden, kan x niet op een van de vol- 
gende plaatsen staan. Na een lege plaats die komt na s[h(x)] kunnen 
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alleen waarden z staan waarvoor geldt h(z) fh(x). Als delete-opera- 
ties ook zijn toegestaan, gaat het voorgaande argument niet meer op, 
want de lege plaats kan ontstaan zijn door een delete-operatie. Om 
deze moeilijkheid te voorkomen is de speciale waarde 'weg' geïntro- 
duceerd. Als j een component is waarvan de waarde verwijderd 
moet worden vanwege een delete-operatie, krijgt component j de 
waarde 'weg'. Een component heeft alleen de waarde 'leeg' als de 
component nog niet bij een insert-operatie betrokken is geweest. 
Het array kan nu vol raken met waarden van V en waarden 'weg'. 
Op een gegeven moment zal dan het array gereorganiseerd moeten 
worden: op alle waarden van de componenten die niet 'weg! zijn, 
wordt opnieuw de hashing-functie toegepast, samen met de functie 
g om zo een nieuwe plaatsing te vinden. 

Bij gesloten hashing kan gebruik worden gemaakt van de functie 
plaats: 


function plaats(x: t; s: array[0..m-1] of k): 0. .m-1; 


{pre: B(s) 
post: s[ plaats] = x v s[plaats] = leeg v 
((Ej: OS j S m-1l: plaats = J) A 
(Ai:OS is mirslil # x))} 


var start, i: integer; 
begin start. := h(x); 1 := 0; 
while (i < m) and (sl (start +i) mod m] <> x) and 
(sl(start +i) mod m] <> leeg) do i := i+1; 
plaats := (start +i) mod m sen 


end 


In het bovenstaande staat het type k voor het type waarvan de 
waardenverzameling gelijk is aan de vereniging van de waardenver- 
zameling van het type t en van de verzamelingen {weg} en {leeg}. 
Met de functie plaats worden bijvoorbeeld de operaties el, insert 


en delete: 


function el(s: dict(t); x: t): boolean; 
begin el := (slplaats(x,s)] = x) end; 
procedure insert(var s: dict(t); x: t); 
var j: integer; 
begin j := plaats(x,s); 
if s[jl = leeg then sljl := x 
say else if s[j] <> x then error(overflow) 


end; 
procedure delete(var s: dict(t); x: t); 
var j: integer; 
begin j := plaats(x,s); if slj] = x then s[j] := weg end 


De procedure error in insert zorgt voor het reorganiseren van het 
array en het alsnog opnemen van de waarde x. 
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De functie plaats maakt gebruik van lineair proberen. Een 
nadeel hiervan is dat de waarden in het array zich opeenhopen bij 
een aantal indices, Dit kan voorkomen worden door gebruik te maken 
van kwadratisch proberen. Het wordt dan moeilijker om te bewijzen 
dat, als er nog een lege plaats is, deze ook wordt gevonden. 


Opmerking over efficiëntie van hashing 


Als bij open hashing het array b elementen bevat en card(V) =n, 
dan bevatten de buckets gemiddeld n/b elementen. De operaties 

el, insert en delete vragen dan gemiddeld een tijd O(1 +n/b), 
waarin de constante 1 staat voor de toepassing van de hashing- 
functie. Ook n en b zijn constanten, dus de operaties gaan in con- 
stante tijd. Dit geldt als de functie h de waarden gelijkelijk verdeelt 
over alle buckets. In het slechtste geval, alle waarden komen in één 
bucket, zijn de operaties lineair in n. 

Bij gesloten hashing hangt de snelheid van de operaties af van 
de kwaliteit van de hashing-funetie en van de rehash-functie. De 
snelheid wordt sterk verbeterd als we in het array een zekere over- 
capaciteit nemen, als het aantal elementen van het array een fractie 
groter is dan card(V). Als m het aantal array-elementen is en 
card(V) =n met m >n en we geven n/m aan met a, dan kan aange- 
toond worden dat het gemiddelde aantal slagen van de functie 
plaats (1 + (1/(1-9)))/2 is als x voorkomt in het array, en 
(1 + (1/(1-4)?)) als x niet voorkomt. 


8.5 OPGAVEN 


1. Priority queues kunnen geimplementeerd worden met behulp van 
binaire zoekbomen. | 
Geef een definitie en een implementatie voor een abstracte data- 
structuur voor priority queues met als operaties 


- empty : creatie van lege verzameling; 

- isempty : test op het leeg zijn van de verzameling; 
- element : test op het aanwezig zijn van een element; 
- insert  : toevoegen van een element; 


- deletemin: verwijderen van kleinste waarde. 


2. Open hashing kan gerealiseerd worden met behulp van kettingen. 
Geef algoritmes voor de operaties inserten delete, ervan uit 
gaande dat gegeven zijn: 


- de hashing-functie h 
- het basistype t 
— de hashtabel arraytdeen} of. seis. 
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3. Geef de algoritmes voor de operaties union en find voor union- 
find algoritmes voor de twee mogelijke implementaties van de 
waarden, met behulp van kettingen respectievelijk met behulp 
van een array, genoemd in 8.4.4. 


4, In een 'abstract' algoritme wordt gemanipuleerd met waarden van 
het type 


type settype = set(1..n) 


waarin n groot is (bijvoorbeeld 10%). Bekend is dat in het algo- 
ritme iedere waarde van dit type uit hooguit p (0 < p < n) ele- 
menten bestaat en ook dat dit aantal elementen meestal ongeveer 
p is. Stel 


var Ss‚t: settype; 
Nr dont de 


De operaties die uitgevoerd worden zijn: 
1l. z se min(s); 


while x<= max(s) 
do begin f(x); x := opv(s,x) end 


waarin: 
min(s) : minimale waarde in s 
max(s) : maximale waarde in s 


opv(s,x): de opvolger van x in s; als x = max(s) dan geldt: 
opv(x) =n+1 
f(x) : willekeurige operatie op x (verder niet van belang). 


2. insert(x,s) 


x toevoegen aan s. 


dt for allk ins N € do g(x) 


voor alle x in de doorsnede van s en t moet de operatie g 
(verder niet van belang) worden uitgevoerd. 


In het ‘concrete! programma kan niet met het settype gewerkt 
worden. Daarom moet dit, met de bovenstaande operaties, worden 
geïmplementeerd waarbij rekening wordt gehouden met: 


- de benodigde geheugenruimte; 
- de benodigde 'tijd' voor bovenstaande operaties. 


a. Geef de implementatie voor p = 10. 


b. Geef de implementatie voor p = 10°. 


Beredeneer de keuzes. 
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5. We willen nagaan of een verzameling a deelverzameling is van een 


andere verzameling b. De elementen van de verzamelingen zijn 
positieve gehele getallen. Beide verzamelingen worden gerepre- 
senteerd in een array, respectievelijk A en B. 

Gegeven: 


type nat = 1..maxint; 

var m,n: nat; 
A: arrayl1..m] of nat; 
B: arrayl1..nl of nat; 


De variabelen m, n, A en B hebben een waarde en wel zodanig 
dat geldt: 


en we n 
+- TAL] S i j Sms Ali} = Alj] =» ly) 
= LALA š ij 3 nsslij e= BL » 1:23) 


Met andere woorden, er geldt: 


- het aantal elementen in het array A is kleiner dan het aantal 
elementen in het array B; 

- voor het array A geldt dat alle elementen verschillend zijn; 

- voor het array B geldt dat alle elementen verschillend zijn. 


Gevraagd wordt: Bepaal op vier verschillende manieren, die 
hieronder worden gespecificeerd, of alle elementen in de verza- 
meling a voorkomen in de verzameling b, en leg dat resultaat 
vast in: 


var p: boolean; 
Met andere woorden, geef p een zodanige waarde dat geldt: 
p = (Ai: 1 sie ms: BIER B sn: Atik Blijd 


Tevens dient de efficiëntie (uitgedrukt in het aantal handelingen) 
van de te construeren algoritmen bepaald te worden. 


a. Construeer een algoritme dat bovenstaande eindrelatie reali- 
seert, waarin de arrays A en B niet gesorteerd worden en 
waarbij geen hulparray gebruikt wordt. 

Bepaal de orde van dit algoritme, 


b. Construeer een algoritme dat bovenstaande eindrelatie reali- 
seert, waarin eerst zowel het array A als het array B in stij- 
gende volgorde gesorteerd worden, en waarbij geen hulparray 
gebruikt wordt. In het algoritme dient gebruik gemaakt te 
worden van het feit dat beide arrays gesorteerd zijn. 
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c. Construeer een algoritme dat bovenstaande eindrelatie reali- 
seert, waarin het array A niet gesorteerd wordt en het array 
B wel in stijgende volgorde gesorteerd wordt, en waarbij 
geen hulparray gebruikt wordt. 
Bepaal de orde van dit algoritme. 


d. Construeer een algoritme dat bovenstaande eindrelatie reali- 
seert, waarbij gebruik gemaakt wordt van een hulparray. 
Introduceer: 


var C: arrayl0..n-1] of sequence(nat). 
In het algoritme dient C als waarde te krijgen: 


(C[i] (0 < i sn-1) is de rij van waarden uit B[1..n] waarvoor 
geldt: B[j]mod n =i) 


Bepaal de orde van dit algoritme. 
In feite wordt C als hashtabel en de functie mod n als hashing- 
functie gebruikt. 


e. Evalueer in het kort de efficiëntie in tijd en geheugengebruik 
van de geconstrueerde algoritmen. 


N.B. Voor het sorteren van een array kan een standaardalgo- 
ritme gekozen worden. Dit sorteeralgoritme dient in de 
efficiëntiebeschouwingen te worden meegenomen ! 


6. Een waarde van het type set(integer) kan worden geimplemen- 
teerd door een geordende, lineaire lijst met als type van de ele- 
menten: 


type elt = record v: integer; p: telt end; 
Dat een lijst geordend is wil zeggen: 


als a en b variabelen van het type telt zijn en er geldt 
aħp =b (b # nil), dan geldt at.v < b4. v 


Voor het laatste record e van een lineaire lijst geldt et‚p = nil. 
Een waarde van een set bevat alleen verschillende elementen. 


Notatie: De waarde van een set wordt genoteerd met een hoofd- 
letter. De waarde van een set is toegankelijk door middel van 
een variabele, aangeduid door de corresponderende kleine letter, 
van het type telt die wijst naar het eerste record van zo'n line- 
aire lijst; als de set leeg is, is de waarde van die variabele nil. 


Voorbeeld: als S ={S1,S2,...,‚Sn} dan wijst 


var 8: foit; © 
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naar het eerste record van de lineaire lijst waarin de integer- 
waarden sj tot en met sn geordend zijn opgeslagen. 
Als S = 9 dan geldt s = nil. 


Gevraagd: Ontwerp een abstract datatype voor de set met de 
volgende operaties, uitgedrukt in operaties op lineaire lijsten. 


1. {a = A} function leeg(a: telt): boolean {leegla) = (A = Ø)} 
2, {a = A} function elementvan(x: integer; a: telt): boolean 
{elementvan (x,a) = (x € A)} 


3, {a =A ^ b =B} procedure vereniging(var c: telt; a,b: telt) 
(CK UB} 

4. {a =A ^A b =B} procedure doorsnede(var c: telt; a,b: telt) 
{Cm A N B} 

5, {a = AA D = B} procedure verschil(var C: telt; a,b: telt) 
{CC = ANB} 


7. Gegeven zijn een functie f met heading 

function f(x,y: integer): integer 

en een invoerrij van de vorm n‚aj,...,an, waarvoor geldt: 

- n,‚aj,...,an Zijn gehele getallen; 

e E T 

- de getallen aj (i: 1< i< n) zijn onderling verschillend. 

We willen op een verzameling v het volgende algoritme toepassen: 
'geef v als beginwaarde de verzameling {ay,...,an}; 
while 'v bevat ten minste twee elementen' 


do begin 'verwijder de kleinste twee elementen (zeg a en b) 
Uit v'; 


‘voeg het element f(a,b) aan v toe' 
end; 
'druk het resterende element van v af' 


Maak een programma voor dit algoritme. Kies zelf een geschikte 
implementatie van de benodigde verzamelingen en operaties in 
een abstract datatype en motiveer uw keuze. Gebruik van het 
Pascal set type is niet toegestaan. Indien gewenst mag voor n 
een bovengrens aangenomen worden. 


8. De knooppunten van een willekeurige boom worden genummerd 
van 1 tot en met n. De boom wordt nu gerepresenteerd door 


var tree: array[nodes] of record data: item; 
parent: range 
end; 


Verzamelingen 


waarin 


de ir 
Grin? 


type nodes 
range 


en het type item voor de opgave niet van belang is. 
De parent-component van een knooppunt verwijst naar de voor- 
ganger van het knooppunt. Zo kan de boom 


A 


Eeoa 
| 


I 
gerepresenteerd zijn door 
k : E RE E KN 
tree[k].parent : Oren ate I S T 
PRGCEKE RED, in A B OD Ir RoG oD g 


De 'voorganger van de wortel' wordt met 0 aangegeven. 
Gevraagd wordt de procedure 


procedure commonancestors(ni,n2: nodes; 
var s: nodeset); 


die de verzameling knooppunten bepaalt die zowel op het wortel- 
pad van n1 als op het wortelpad van n2 liggen. (Het wortelpad 
van een knooppunt k is het pad van k naar de wortel.) 


Hint: Schrijf een hulpprocedure die de verzameling knooppunten 
bepaalt in het wortelpad van een gegeven punt. 

Bedenk een goede representatie voor het type nodeset, rekening 
houdend met de toe te passen operaties (en het feit dat de knoop- 
punten genummerd zijn van 1 tot en met n). 


9. Bij de implementatie van de setstructurel met behulp van sequen- 
ces (bladzijde 221) hebben we gesorteerde sequences genomen. 
Wat verandert er aan de implementatie als we met ongesorteerde 
sequences werken? 

En wat betekent dat voor het realiseren van operaties als insert 
en delete? 
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10. Gegeven: 


type gesl = (man,vrouw); 
interesse = (kunst, lezen,muziek,toneel,politiek, sport); 
klant = record identiteit: sequence(char); 
sexe: gesl; 
leeftijd: 18..82; 
hobbys: set(interesse) 
end; 


De variabelen 


var kandidaten: sequence(klant); 
nieuw: klant; 


hebben een waarde. 


Gevraagd een programma dat bepaalt of er tussen de kandidaten 
iemand is die past bij de nieuwe klant; ‘passen bij' is gedefini- 
eerd als: 


- verschillende sexe; 
- leeftijdsverschil kleiner dan 10 jaar 
- ten minste één gemeenschappelijke hobby. 


11. Een gebouw bevat een aantal kamers. Elke kamer is toegankelijk 
door een deur met een slot. Elk slot is gekarakteriseerd door een 
uniek identificatienummer en een vijftal gatenpatronen. Elk 
gatenpatroon is een deelverzameling uit [1..10]. 


type slot = record id: integer; 
pa: arrayl1..5l of patroon 
end; 


type patroon = set(1..10); 


In het gebouw werken een aantal personen. Elke persoon heeft 
een uniek identificatienummer en een bos sleutels. Elke sleutel 
bestaat uit vijf pinnen. 


type persoon = record id: integer; 
bos: sequence(sleutel) 
end; 
type sleutel = arrayl1..5] of pin; 
type pin = 1..10; 


Een sleutel past op een slot indien voor elk van de gatenpatro- 
nen geldt dat de overeenkomstige pin van de sleutel past in één 
van de gaten van het gatenpatroon. Een pin past in een gatenpa- 
troon indien de waarde van de pin element is van de verzameling 
patroon. 
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12. 


Voorbeeld: Als een waarde van het type slot is: 
(10:12 0S) rS, 5, 73, {4},L1,3,6,9};{2,4,5}) 


dan zal de waarde (6,1,4,6,5) van het type sleutel passen op 
het genoemde slot en de waarde (6,2,4,3,4) niet (2 komt niet 
voor in {(1,3,5,T5). 


Gegeven zijn alle sloten en alle personeelsleden in de variabelen: 


var sloten: sequence(slot); 
personeel: sequence (persoon); 


Gevraagd wordt voor elk slot alle personen te bepalen die een 
sleutel hebben voor dat slot en deze gegevens te administreren 
in: 


var out: sequence(slotgeg); 
type slotgeg = record id: integer; 
P: sequence( integer); 
end; 


Stel s is een waarde van het type slotgeg dan is s.id het identi- 
ficätienummer van het slot en s.P de rij van identificatienum- 
mers van de personen die een op dat slot passende sleutel heb- 
ben. 


Gegeven: 


type stad = 1..100; 
steden = set(stad); 
buren = arraylstad] of steden; 
var verbonden: buren; Ba 
na a,b: stad; 
aantal: integer; 


De variabele verbonden heeft een waarde, en wel zodanig dat 
voor elke p en q van het type stad geldt: 


(q E verbonden[p]) = (er is een directe lijnvlucht van 
stad p naar stad q) 


De variabelen a en b hebben ook een waarde. 


Gevraagd: Schrijf een programma dat aan de variabele aantal 
toekent het aantal lijnvluchten, dat minimaal nodig is om van 
stad a naar stad b te vliegen. Gegarandeerd is dat elke waarde 
van het type stad vanuit elke andere waarde van het type stad 
direct of indirect bereikbaar is. 


9 RECURSIEVE DATASTRUCTUREN 


9,1 INLEIDING 


In hoofdstuk 5 werden kettingen en binaire bomen opgebouwd met 
behulp van pointers. We kunnen bijvoorbeeld binaire bomen in een 
Pascal-programma introduceren omdat in Pascal bij pointers een 
soort recursie is toegestaan in een typedefinitie: 


type knoop = record w: basistype; 
kyr? tknoop 
end; 


Een waarde van het type knoop representeert echter niet de hele 
binaire boom doch slechts één knooppunt van de boom. Een analoge 
situatie treedt op bij rijen die we als kettingen voorstelden in hoofd- 
stuk 5. In hoofdstuk 7 zagen we hoe we met behulp van abstracte 
datatypen (structuren) sequences konden introduceren op een zoda- 
nige wijze dat de algoritmen gebruik maakten van operaties op 
gehele sequences. De implementatie van de sequence zorgde ervoor 
dat de operaties op een (totale) sequence werden omgezet in opera- 
ties op de elementen van kettingen (of van arrays). De sequence- 
structuur zou, net als de arraystructuur, in een programmeertaal 
opgenomen kunnen zijn, waardoor we deze niet zelf met behulp van 
een abstracte datastructuur zouden behoeven te implementeren. 
Hetzelfde geldt voor de binaire-boom-structuur. En zo zouden we 
door kunnen gaan voor alle structuren die met behulp van pointers 
gerealiseerd kunnen worden. Er zou dan een taal ontstaan met ont- 
zettend veel datastructuren. De kans is echter groot dat bij het 
programmeren in die taal toch weer blijkt dat een bepaalde data- 
structuur erg plezierig zou zijn voor de oplossing van een bepaald 
probleem, maar dat die structuur nou weer net niet in die taal voor- 
komt. Er is dan toch een constructiemogelijkheid nodig, zoals de 
pointer, om zo'n structuur te bouwen als abstracte datastructuur. 
De pointer is echter erg primitief gereedschap, staat erg dicht bij 
de machine. 

In dit hoofdstuk bekijken we een andere mogelijkheid voor het 
invoeren van structuren als rijen en binaire bomen. We voeren een 
mogelijkheid in voor het definiëren van recursieve typen (structuren), 
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anders dan met pointers. Een taal waarin zulk soort typen aanwezig 
is, is de programmeertaal LISP. 


We breiden de typedefinitiemogelijkheden van Pascal uit en met name 
de mogelijkheid van de enumeratie. De definitiemogelijkheid 


<type definition> ::= type <type identifier» = (<identifier list>); 


breiden we uit tot 


<type definition> ::= type <type identifier> = («generator list>); 
<generator list> : := <generator> { „<generator>} 
<generator> ::= <generator identifier> | <generator identifier> 


(<type list>) 
<type list> ::=<type> {,<type>} 


Bij een enumeratietype in Pascal wordt in de definitie van het type 
de waardenverzameling opgesomd: 


type kleur = (rood,geel,groen,blauw) ; 


In de nieuwe typedefinitie sommen we 'soorten' op van waarden, bij- 
voorbeeld : 


type ntuple = (twee( integer, integer), 
drie(integer, integer, integer) ); 


De waardenverzameling van het type ntuple bestaat uit twee ‘soorten! 
waarden, die aangegeven worden met de namen (generatoren) twee 
respectievelijk drie. Voorbeelden van waarden zijn: twee(3,7), 
drie(15,-27,100), twee(-35,maxint). Bij de notatie van waarden 

geeft de naam van de generator de soort van de waarde aan; de 
generator(naam) heeft hierbij een constructief unctie. 

De lijst van typen bij een generator geeft de structuur van de 
soort aan. Zo bestaat een waarde van het soort twee van het type 
ntuple uit een rij van twee integers. De volgorde in de lijst van 
typen is ook belangrijk. Zo is inre(12,13.4) wel een waarde van het 


type 


type ir = (inre(integer,real), inrere(integer,real,real)); 


maar inre(7.8,36) niet. 

Als geen van de generatoren voorzien is van een type list, komt 
de definitie overeen met de Pascaldefinitie van een enumeratietype. 
Zo'n generator zonder type list noemen we een constante. De gene- 
rator gebruiken we bij de notatie van een waarde. We zullen later 
nog een ander gebruik ervan tegenkomen. 

Als het type ntuple gedefinieerd is, kunnen variabelen gedecla- 
reerd worden: 
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var nł;n2: ntuple 


Ook is de assignment toegestaan: 
nl := twee(3,7); n2 := drie(15,-27,100); nl $= n2 


We staan nu ook toe dat in de typedefinitie het type voorkomt (in 
het 'rechterlid') dat gedefinieerd wordt. Zo krijgen we de beschik- 
king over zogenaamde recursieve datatypen. Stel dat we het type 
arithmetische expressie willen definiëren; we willen dus een type 
vastleggen waarvan de waardenverzameling arithmetische expressies 
zijn. Hierbij willen we abstraheren van de verschijningsvorm van de 
expressie, zoals a * (b+7), en ons concentreren op de opbouw van 
de expressies. We gebruiken als definitie: 


type expression = (constant(number), variable(identifier), 
minus(expression), sum(expression,expression), 
product (expression,expression), 
quotient(expression,expression)); 


We zijn er hierbij van uit gegaan dat de typen number en identifier 
reeds gedefinieerd zijn. In de definitie wordt vastgelegd: 


- de naam van het type: expression; 

- de namen van de generatoren: constant, variable, minus, som, 
product en quotient; 

- bij elke generator de argumenten (aantal en type). 


De zes generatoren in het voorbeeld leggen vast: 


constant: een number wordt een expression; 
variable : een identifier wordt een expression; 


- minus : maakt van een expression een nieuwe expression; 
GN - 

- product : maken van twee expressions één nieuwe expression. 
- quotient: 

Als we nu toch even de tekens -, +, * en / gebruiken, kunnen we 


de waardenverzameling van het type expression beschrijven als: 


- alle waarden van het type number kunnen, via de generator 
constant, waarden van het type expression worden; 

- alle waarden van het type identifier worden, via de generator 
variable, waarden van het type expression; 

- als e een expression is, dan is ook -e een expression; 

- als el en e2 expressions zijn, dan zijn ook el + e2, el * e2 en 
el / e2 expressions. 

(En: er zijn geen andere waarden van het type expression.) 
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Na de bovenstaande typedefinitie kunnen variabelen van dit type 
gedeclareerd worden: 


var el,e2,e3: expression; 


Met behulp van de generatoren kunnen constanten van het type 
expression genoteerd worden: 


el := variable(b); e2 := constant(7); 


el := sum(el,e2); {we hadden ook direct kunnen schrijven 
el := sum(variable(b),constant (7) )} 
e2 := variable(a); e3 := product(e2,el) 


Nu heeft e3 als waarde een expression die normaliter genoteerd 
wordt als: a * (b+7). Zo ook staat 


sum(constant(2),product(variable(a),variable(b))) 


voor de expressie 2 +a *b,. 

In dit soort typedefinities wordt als het ware de opbouw van de 
structuur aangegeven. Daardoor lenen ze zich goed voor het reali- 
seren van operaties die op de (opbouw van de) structuur manipule- 
ren (bijvoorbeeld de afgeleide van een functie bepalen, een lijst 
omkeren, etcetera). 

Stel dat we van een waarde van het type expression willen bepa- 
len wat het aantal plustekens zou zijn in de ‘normale! notatie. Als 
we dit aantal voor de expression e aangeven met N(e), dan geldt 
voor N: 


N(eonstant(n)) = 0 

N(variable(i)) = 0 

N(minus(e)) = N(e) 

N(sum(el,e2)) = N(el) + N(e2) + 1 
N(product(el,e2)) = N(el) + N(e2) 
N(quotient(el,e2)) = N(el) + N(e2) 


We kunnen deze recurrente betrekkingen gebruiken voor het decla- 
reren van de recursieve functie: 


function pluscount(e: expression): integer; 


product(el,e2) : pluscount : 
quotient(el,e2): pluscount 
end 


pluscount{(el) + pluscount (e2); 
pluscount(el) + pluscount(e2) 


pre: true 
post: pluscount(e) = N(e) met voor N zie de definitie} 
begin case e of 
constant (n) : pluscount := 0; 
variable(i) s pluscount := 0; 
minus (m) : pluscount := pluscount (m); 
sum(el,e2) : pluscount := 1 + pluscount(el) + pluscount(e2); 


end 
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In de functie wordt gebruik gemaakt van een nog niet bekende vorm 
van de case-statement. Het effect hiervan is dat de generator van e 
wordt vastgesteld en dat de statement wordt uitgevoerd die komt na 
de dubbele punt volgend op deze generator. Hier heeft de genera- 
tor(naam) dus een selectiefunctie. De generatoren zijn voorzien van 
een soort formele, lokale namen (waarvan het aantal gelijk is aan het 
aantal typen in de type list van de betreffende generator in de type- 
definitie), die gebruikt worden in de statement. De definitie van 
deze case-statement luidt: 


<case statement> ::= case <expression> of <case list> end 
<case list» ::= <case līst element> {; <case list element>} 
<case list element> ::= <generator indication> : <statement> 
<generator indication> ::= <generator identifier> | 

<generator identifier>(<formal name list>) 
<formal name list> ::= <formal name> { , <formal name >} 
<formal name> ::= <identifier> 


Het type van de expression moet hetzelfde zijn als dat van de gene- 
ratoren. 

Laten we als tweede voorbeeld van een functie voor het type 
expression kijken naar een functie die de afgeleide bepaalt van een 
waarde van het type expression. Let wel: deze case-statement komt 
niet in Pascal voor (ook de typedefinitie niet). De onderstaande 
functie levert een niet-enkelvoudige waarde op, wat eveneens niet 
mogelijk is in Pascal. 


function deriv(e: expression; t: identifier): expression; 
{pre: true ty 
post: deriv(e,t) = de/dt} 
begin case e of 


constant(c) : deriv := constant(0); 

variable(v) : if v = t then deriv := constant(1) 
Ta else deriv := constant(0); 

minus(u) : deriv := minus(deriv(u,t)); 


sum(u, V) : deriv : 
product(u,v) : deriv : 


sum(deriv(u,t),deriv(v,t)); 
sum(product(u,deriv(v,t)), 
product(deriv(u,t),v)); 
quotient(sum(product(deriv(u,t), v), 
~ product (minus(u),deriv(v,t))), 
product (v,v)) 


quotient(u,v): deriv : 


end 


end 


In de functie worden expressies als e +0, e * 0 ene * 1 niet ver- 
eenvoudigd. Zo geldt voor de aanroep: 
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deriv(sum(constant(2),product(variable(x),variable(y))),x) 
{= d(2+x.y) /äx} 
= sum(deriv(constant(2),x),deriv(product(variable(x), 
variable(y)),x)) 
{= d2/ax + d(x.y) /dx} 
= sum(constant(0),sum(product(variable(x),deriv(variable(y),x)) 
product(deriv(variable(x),x),variable(y)))) 
{= 0 + (x.dy/dx + y.dx/dx) } 
= sum(constant(0),sum(product(variable(x),constant(0)), 
product (constant(1),variable(y)))) 
{= 0 + (x.0+1.y)} 


Het resultaat is dus 0 + (x.0+1.y) (de representatie daarvan). 

Als in de functie de afgeleide van een bepaalde expressie meer- 
dere keren nodig is, wordt deze afgeleide steeds opnieuw berekend. 
De functie is dus op een aantal manieren te optimaliseren. 


In de volgende paragrafen zullen we een aantal (data)structuren 
beschouwen, gedefinieerd op de hierboven beschreven manier, zodat 
vooral operaties die de opbouw van de structuur manipuleren ge- 
schikt te realiseren zijn. Allereerst kijken we naar rijstructuren, 
met als voorbeeld de S-expressies van LISP, vervolgens naar 
(samengestelde) lijsten, dan naar bomen en tot slot naar binaire 
(zoek)bomen. Voorlopig nemen we aan dat deze mogelijkheid van het 
definiëren van recursieve datatypen/structuren toegestaan is. We 
kunnen deze typedefinitiemogelijkheid dan gebruiken om abstracte 
datatypen /structuren te implementeren. Als afsluiting zal in 9.6 de 
implementatie (oftewel simulatie) van deze typedefinitiemogelijkheid 
met behulp van pointers behandeld worden. 


9.2 SIMPLE LISTS 


In hoofdstuk 7 hebben we laten zien dat we rijen niet hoeven te 
beschouwen als kettingen, zoals in hoofdstuk 5, maar dat we de 
kettingen kunnen vervangen door de abstractere representatie van 
sequences. De algemene sequence werd dan zelf weer geïmplemen- 
teerd met behulp van dubbel geketende kettingen. De enkelvoudige 
ketting heeft echter een 'recursief karakter': een enkelvoudige 
ketting wordt gevormd door het eerste element (aangewezen door de 
aangrijppointer'), gevolgd door een rest, wat weer een ketting is. 
Met onze recursieve definitiemogelijkheid kunnen we dit karakter nu 
vastleggen in een typedefinitie, zonder dat we van pointers gebruik 
moeten maken. 

Uitgaande van een reeds gedefinieerd basistype kunnen we defi- 
niëren: 
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type SimpleList = (Sempty,Scons(basistype,SimpleList)); 


In dit voorbeeld heeft de eerste generator geen argument, geen 
type list, en is dus een constante. 

Voor de notatie van een waarde van het type Simplelist kunnen 
we de volgende conventie aanhouden: 


Sempty noteren we als ( ) 
Scons(t,s) noteren we als (t) ~ s. 


Bijvoorbeeld: Scons(t1,Scons(t2,Sempty)) noteren we als (t1,t2). 


Stel dat we een functie willen construeren die het aantal waarden 
van het basistype bepaalt dat in een zekere SimpleList voorkomt. 
Laten we dit aantal voor SimpleList s aangeven met N(s). Er geldt: 


N(Sempty) = 0 
N(Seons(e,s)) = 1 + N(s) 


Uit deze recurrente betrekking kan de volgende functie afgeleid 
worden : 


funetion countel(sl: SimpleList): integer; 
pre::true 
post: countel(sl) = N(sl)} 
begin case sl of 


Sempty : countel := 0; 
Scons(a,b): countel := 1 + countel(b) 
end 


r 


end 


eee o 


We kunnen het probleem ook oplossen met een 'iteratieve body': 


function countel2(sl: SimpleList): integer; 

pre: true 

post: countel2(sl) = N(s1)} 
var a: integer; 

s: SimpleList; 
begin a := 0; s := sl; {inv.: P: N(sl) = a+N(s)} 
while s <> Sempty do 
begin {P A (Er‚e: : s = Scons(e,r))} 
case S of 
Sempty 


Scons(e,r): {N(sl)=a+N(s)=a+(1+N(r))} 
begin s := r; 
{N(sl) =a+1+N(s)} 
a:=atl 
{P} 
end 
end kig 
{P} 
end; 
{P A S= Sempty, d.w.z. PAN(s) =0, d.w.z. N(sl) = a} 
countel2 :=a 


end 
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Vanwege de recursieve datastructuur ligt recursie voor de hand. 
maar, zoals we zien, kunnen ook niet-recursieve algoritmen gebruikt 
worden. Laten we hiervan nog een voorbeeld bekijken. We gaan er 
voor het voorbeeld van uit dat het basistype het type integer is. 
Met P(k‚n,‚s) geven we aan dat de SimpleList s de waarden 
k+1,k+2,...‚n in deze volgorde bevat. (Te denken valt bijvoorbeeld 
aan de ketting: 


Ka 


P karakteriseert dan zo'n ketting.) We willen nu bij gegeven n (2 0) 
een SimpleList s maken waarvoor P(0,n,s) geldt. Voor de eigenschap 
P geldt: 


P(n‚n,‚Sempty) 
P(k-1,n,Scons(e,s)) = ((e = k) A P(k‚n,‚s)) 


Als invariant voor de repetitie kiezen we P(k,n,5); 


S. ¿= Sempty; k «s= n; 
{P(k,n,s)} 
while k > 0 do 
begin {P(k,n,s) A O < k < n} 
_ 8 «= Scons(k,s); k= k+l 
{P(k‚n‚s) AO Sk Sn} 
end 
{P(k‚n‚s) A k = 0} 


Vergelijk dit algoritme met dat in 5.2.4 voor kettingen. Het is 
natuurlijk ook mogelijk een recursief algoritme voor de oplossing 
van dit probleem te schrijven. 

Als we ons in het algemeen (ook bij andere basistypen dan het 
type integer) voorstellen dat de elementen van een SimpleList 
genummerd zijn op de wijze waarop zojuist de integers 1,2,3,...‚n 
in de SimpleList zijn opgenomen, dan kunnen we het predicaat 
R(x,k,s) definiëren als: de waarde x komt in de SimpleList s voor 
op de ke plaats. Voor R geldt: 


R(x,k,Sempty) 
R(x,1,Scons(y,‚s)) = (y = x) 
R(x,k+1,Scons(y,s)) = R(x,k,s) 


De volgende functie levert bij een gegeven SimpleList het ke ele- 
ment : 
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function retrieve(sl: SimpleList; k: integer): basistype; 
{pre: 1 Sk Ss N(sl) 
post: R(retrieve(sl,k),k,sl) } 
begin case sl of 


Sempty EN, 
Scons(y,s): if ky= 1.then retrieve. := y 
else retrieve := retrieve(s,k-1) 
end 


end 


N.B. In de literatuur komen we de SimpleList ook wel tegen onder 
de namen lineaire lijst en ketting. Als operaties worden wel 
genoemd: 


head(sl) {is: retrieve(sl,1)} 
tail(sl) {als sl = Scons(a,s) dan tail(sl) = s} 
- insert(x,‚p,sl) {voeg x toe aan sl op plaats p (en de ele- 
menten die oorspronkelijk de plaatsnummers 
Pp‚p+1l,p+2,... hadden krijgen de plaatsnum- 
mers p+1,p+2,p+3,...} 
locate(x,sl) {geeft de kleinste waarde van p, 
1 Sp sS N(sl), waarvoor geldt: 
retrieve(sl,p) = x; komt x niet voor als 
element van sl dan is het resultaat 0} 
delete(p,sl) {verwijder uit sl het element met plaatsnum- 
mer p} 
succ(p,sl) {element met plaatsnummer p+1 als 
p < N(s1)} 
- pred(p,sl) {element met plaatsnummer p-1 als p > 1} e 


Laten we nog twee andere functies construeren. De eerste functie 
voegt een waarde van het basistype toe aan een SimpleList door 
deze waarde ‘achter! de SimpleList te plaatsen (met behulp van 
Scons kunnen we een waarde van het basistype 'aan de voorkant! 
toevoegen aan een SimpleList). We geven met het predicaat A(x,‚y,z) 
aan dat z het resultaat is van append(x,y). Voor A geldt: 


A(x,‚Sempty,Scons(x,Sempty)) 
A(x,‚Scons(a,s),Secons(b,t)) = ((a =b) A Alx‚s,t)) 


Zo vinden we: 


function append(x: basistype; sl: SimpleList): SimpleList; 
pre: true 
post: Alx,‚sl,append(x,sl))} 
begin case sl of 


Sempty s append := Scons(x,Sempty); 
Scons(a,b): append := Scons(a,append(x,b)) 
end 


end 
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De tweede functie keert de volgorde van de elementen in een 
SimpleList om. Laten we de eigenschap dat x 'de omgekeerde 
SimpleList' is van y aangeven met O(y) = x. Er geldt: 


O(Sempty) = Sempty 
O(Secons(a,b)) = append(a,O(b)) 


Hieruit leiden we af: 


function reverse(sl: SimpleList): SimpleList; 
{pre: true 


post: reversel(sl) = O(sl)} 
begin case sl of 
sempty : reverse := Sempty 
Scons(a,b): reverse := append(a,reverse(b)) 
end 
mo 


Als de SimpleList sl bestaat uit n waarden van het basistype, dan 
zal de aanroep van de functie reverse resulteren in n aanroepen 
(recursief) van reverse met als 'lengtes' van het argument achter- 
eenvolgens n-1,n-2,...,2,1,0. Elke aanroep van reverse leidt ook 
tot een aanroep van de functie append. Een aanroep van append met 
een argument ter lengte k leidt weer tot k (recursieve) aanroepen 
van append. Voor elke aanroep wordt de constructiefunctie Scons 
uitgevoerd. Eén aanroep van reverse met een argument ter lengte n 
leidt dus tot een algoritme met tijdscomplexiteit O(n?) (als we de 
complexiteit uitdrukken in het aantal malen dat Scons wordt uitge- 
voerd). Dit kan voorkomen worden door gebruik te maken van een 
zogenaamde accumulerende parameter. Dit is een parameter waarin 
het 'tussenresultaat!' van een berekening wordt bewaard. Als functie 
nemen we nu: 


function rev(x,y: SimpleList): SimpleList; 
{pre: Oly) » x = Ss 
post: Oly) = s A rev(x,y) = y} 
begin case x of 
Semp ty Teu: 


Us 
Scons(a,b): rev := rev(b,Scons(a,y)) 
end 


end 


Het resultaat dat bereikt werd door de aanroep reverse(s), wordt nu 
bereikt door de aanroep rev(s,Sempty). De y heeft bij elke aanroep 
als waarde het ‘omgekeerde! van 'het eerste stuk! van s. Als een 
soort invariant geldt dat O(y), geconcateneerd met het actuele argu- 
ment behorende bij de parameter x, steeds gelijk is aan de oor- 
spronkelijke s. 
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Bij de definitie van het type SimpleList zijn we uitgegaan van een 
gedefinieerd basistype. We zouden, zoals we ook al eerder gedaan 

hebben, een definitie kunnen voorzien van een type als parameter, 
waardoor een structuur wordt gedefinieerd. We krijgen dan: 


structure SimpleList(type t) = (Sempty,Scons(t,SimpleList(t))); 


We kunnen dan typen definiëren als 


type slint = SimpleList(integer); 


en we kunnen variabelen declareren als 


var is: slint; 
cs: SimpleList(char); 


De gegeven (en de genoemde) functies zijn van toepassing op de 
structuur, alleen zullen we bij de specificatie van een parameter 
met een SimpleList-structuur nu moeten schrijven: SimpleList(t). 
Zo zal de heading van de functie append gaan luiden 


function append(x: t; sl: SimpleList(t)): SimpleList(t); 


In het bovenstaande hebben we voor SimpleLists alleen de waarden- 
verzameling vastgelegd. We zouden ook een abstract datatype (of 
structuur) hebben kunnen definiëren met als specificatie van de 
operaties: 


{true} CreatesL {CreateSL = Sempty} 

{s = S} SLISMT(s) {SLIsSMT(s) = (S = Sempty)} 

{s = Scons(a,b)} Head(s) {Head(s) a A s = Scons(a,b)} 
{s = Scons(a,b)} Tail(s) {Tail(s) =baAs= Scons (a,b) } 
{true} ConsSL(e,s) {ConsSL(e,s) = Scons(e,s)} 


We zullen hier niet de definitie en de implementatie voor SimpleLists 
geven. We doen dit wel bij de typen en structuren in volgende para- 
grafen. 

Met de bovenstaande operaties kunnen we bijvoorbeeld voor een 
SimpleList, waarvan de elementen van het type integer zijn, de 
volgende functie maken die een nieuwe SimpleList maakt, waarvan 
de elementen de kwadraten zijn van de elementen van het argument 


function sqrsl(x: SimpleList(integer)): SimpleList(integer); 
begin if SLISMT(x) 

then sqrsl : 

else sqrsl : 


XxX 
ConsSL(sqr(Head(x)),sqrsl(Tail(x))) 


end 
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Of een functie die het aantal elementen van een SimpleList bepaalt: 


function length(x: SimpleList(t)): integer; 
begin if SLISMT(x) 

then length : 

else length : 


0 
Í + length(Tail(x)) 


end 


Als de structuur SimpleList gedefinieerd zou zijn, zouden we Simple- 
Lists kunnen gebruiken voor de implementatie van verzamelingen 
(denk ook maar aan sequences). Als abstractiefunctie nemen we: 


V(CreateSL) = Ø 
V(ConsSL(i,s)) = V(s) U {i} 


Ervan uitgaande dat de abstracte datastructuur SimpleList(t) gede- 
finieerd is, en dat de implementatie - met behulp van onze recur- 
sieve definitiemogelijkheid - 'verstopt' is in de implementation 
module, specificeren we de eigenschappen (hier V) en de operaties 
op sets met de gedefinieerde operaties en niet met eigenschappen 
van de implementatie. Vandaar dat V met CreateSL en ConsSL is 
gedefinieerd en niet met Sempty en Scons. 

Als representatie-invariant nemen we dat de SimpleList 'stijgend 
gesorteerd’ is (bij een geordend basistype). Als we deze eigenschap 
aangeven met S, dan geldt: 


S(CreateSL) 
S(ConsSL(i,s)) = (i = (MINx :x € V(ConsSL(i,s)):x)) 


We zullen alleen de implementatie geven; de definitie die daarbij 
hoort zagen we reeds in hoofdstuk 8. 


implementation setstructure2; 
structure set(type t) = SimpleList(t); 
function empty: set(t); 
pre: true 
post: V(empty) = Ø A S(empty)} 
begin empty := CreateSL end; 
procedure insert(var s: set(t); i: t); 
{pre: S(s) A V(s) =X 
post: S(s) A V(s) = X U {i}} 
begin if SLISMT(s) 
then {S} s:= ConsSL(i,s) {S 'A v'} 
else if i # Head(s) 
vi then if i< Head(s) 
~ then sS «= ConsSL(i,s) 
else s := ConsSL(Head(s), 
insert(Tail(s),i)) 


fs 'A v'} 
end; 
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procedure delete(var s: set(t); i: t); 
{pre: S(s) A V(s) = X 
post: S(s) A V(s) = X{äi}} 
begin if not SLISMT(s) 
et phen if i » Head(s) 
zı ther s := Tail(s) 
else if i > Head(s) 
“then s := ConsSL(Head(s), 
delete(Tail(s),i)) 


{S A i y(s)} 
end; 
function el(s: set(t); i: t): boolean; 
{pre: S(s) A V(s) =X 
post: S(a) A êl (dk €-X)} 
begin if SLISMT(s) 
then el := false 
else if í = Head(s) 
then el := true 
else it i < Head(s) 
then el := false 
else el := el(Tail(s),i) 


end; 
function isempty(s: set(t)): boolean; 
{pre: S(s) A V(s) =X 
post: S(s) A isempty = (X = )} 
begin isempty := SLISMT(s) end 
end; Rd 


Bij functies die werken op recursieve datastructuren is vaak, afge- 
zien van de verschillen in toe te passen operaties, een zelfde patroon 
te herkennen. Dit betekent dat we het patroon kunnen vastleggen 

in een functie, die als argument(en) meekrijgt de functie(s) die de 
specifieke operatie(s) voorstelt (voorstellen). We zullen dit laten 
zien voor de functies sqrsl en length, die we eerder gaven. We 

gaan uit van de functie 


function slop(x: SimpleList(t); a: u; 
tumcsaon gtg: es Z? Us: u? 
fune tlon Erge C): S)2 ur 
begin if SLISMT(x) 
then slop := a 
else slop := g(f(Head(x)),slop(Tail(x),a,g,f)) 


end 


Hierin zijn u en s willekeurige typen. (Eenvoudig is na te gaan dat 
in de functie slop de typering bij de functies correct is.) 

Met deze functie slop zouden we het effect van de aanroep 
length(x) kunnen realiseren met de aanroep slop(x,0,plus,een), 
waarin plus een functie is om twee integers op te tellen en een een 
functie is die de waarde 1 oplevert, ongeacht het argument. 
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Tot nu toe lijken we niets gewonnen te hebben. Maar het effect 
van sqrsl(x) wordt ook gerealiseerd door slop(x,CreateSL,ConsSL, 
sqr). Het blijkt dat de functie slop in staat is veel verschillende 
operaties op SimpleLists te realiseren. 


9.3 S-EXPRESSIES VAN LISP 


In de programmeertaal LISP is de enige datastructuur de zogenaamde 
symbolic expression (S-expressie). Zo'n S-expressie is óf atomair 
(van een of ander basistype) óf een geordend paar van S-expres- 
sies, De structuur van S-expressies kan gedefinieerd worden als: 


structure Sexpr(type t) = (atomic(t),pair(Sexpr(t),Sexpr(t))) 


In LISP is een vijftal standaardfuncties gedefinieerd voor S-expres- 
sies. Deze functies kunnen we opnemen in de definitie en implemen- 
tatie van de structuur. Als de S-expressie atomair is zullen we dit 
aangeven met A(s); is het een paar dan geven we dit aan met 

s = P(sl,s2). We krijgen dan: 


definition Sexpressions; 
structure Sexpr(type t); 
function car(s: Sexpr(t)): Sexpr(t); 
pre: s = P(si,s2) 
posts car(S) = sl (As = P(sl,s2))} 
function ecdr(s: Sexpr(t)): Sexpr(t); 
pre: s = P(s1,s2) 
post: cdr(s) = 52 (A sis P(si,s2))} 
function cons(s1,s2: Sexpr(t)): Sexpr(t); 
pre: true 
post: cons(s1,s2) = P(s1,52)} 
function atom(s: Sexpr(t)): boolean; 
{pre: true 
post atom(s) = A(s)} 
function eq(sl,s2: Sexpr(t)): boolean; 
pre: A(s1) A A(s2) 
post: eq(sl,s2) = (si = 52)} 
function se(x: t): Sexpr(t); 
pres true 
post: A(se(x))} 
end; 
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implementation Sexpressions; 
structure Sexpr(type t) = (atomic(t),pair(Sexpr(t),Sexpr(t))); 
function car(s: Sexpr(t)): Sexpr(t); 
begin case s of 
atomic(a): ; 
pair(si,s2): car := sl 
end 
end; 
function cdr(s: Sexpr(t)): Sexpr(t); 
begin case s of 
atomic(a): ; 
pair(sl,8s2): cdr. := s2 


end 
end; 

function cons(sl,s2: Sexpr(t)): Sexpr(t); 
begin cons := pair(sl,s2) end; 


function atom(s: Sexpr(t)): boolean; 
begin case s of 


atomic(a): atom := true; 
pair(sl,s2): atom := false 
end 


end; 
function eq(s1,s2: Sexpr(t)): boolean; 
begin case sl of 
atomic(a): case s2 of 
atomic(b): eq := (a = b); 
pair(u,v): 


end; 
pair(u,v): 
end 
end; 
function se{x:. t): Sexpr(t); 
begin se := atomic(x) end 


end; 


De basisfuncties in LISP voor S-expressies zijn de functies car, cdr, 
cons, atom en eg, waarvan de laatste niets anders is dan de uitdruk- 
king van de gelijkheid in het basistype. We hebben de functie se 
toegevoegd, omdat we (volgens afspraak) buiten de implementatie 
geen gebruik mogen maken van kennis over de opbouw van de waar- 
denverzameling; de functie se is nu nodig om atomaire S-expressies 
te kunnen noteren (anders zou gewoon de notatie atomic(x) gebruikt 
kunnen worden). 

Met deze structuur zouden we nu kunnen declareren: 


var X,y: Sexpr(integer); 


Waarna we als stukje programma zouden kunnen opschrijven: 
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x := se(17); y := se(8); x := cons(se(5),y) 


Met behulp van de basisfuncties kunnen andere functies voor de 
structuur gedefinieerd worden, zoals: 


function equals(sl,s2: Sexpr(t)): boolean; 
{pre: true 
post: equals (s1,s2) = (s1 = s2)} 
begin if atom(s1) and atom(s2) 
then equals := eq(s1,s2) 
else if not (atom(s1)) and not (atom(s2)) 
then equals := equals(car(s1),car(s2)) and 
equals(cdr(s1),cdr(s2)) 
else equals := false 
end; 


Deze functie kan ook geprogrammeerd worden zonder van de basis- 
functies gebruik te maken, als we waren uitgegaan van de eerste 
definitie voor Sexpr. Met de nu gegeven definitie en implementatie 
hebben we de S-expressies uit LISP gesimuleerd, inclusief de ope- 
raties. De implementatie is recht-toe-recht-aan, vandaar dat we de 
pre- en posteondities, uitgedrukt in een abstractiefunctie, hebben 
weggelaten. We zouden bij dezelfde definitie voor S-expressies ook 
een andere implementatie kunnen kiezen, bijvoorbeeld met behulp 
van variante records en pointers. 

De bovenstaande functie drukt uit wat voor alle recursieve typen 
en structuren geldt, namelijk dat twee waarden gelijk zijn als ze 
met behulp van dezelfde constructiefunctie of generator verkregen 
kunnen worden uit gelijke (component-) waarden. 


In LISP bestaat nog een tweede (niet equivalente) definitie voor de 
S-expressie. In deze definitie is een S-expressie óf atomair, óf de 
constante empty, óf een (niet-lege) rij van S-expressies. De niet- 
atomaire S-expressies worden wel lists genoemd. Als de S-expressie 
s een list is, zullen we dit aangeven met s = L(s1,s2,...,sn) (n 2 1). 
Ook deze vorm van de S-expressie kunnen we vastleggen in een 
abstracte datastructuur: 


definition Sexpressions2; 
structure Sexpr2(type t); 
function car(s: Sexpr2(t)): Sexpr2(t); 
(ore: s = blei,B2,..srsnlj.n 2 1 
post: Car(s) = si (A s = L{(si,52,..x,&n}) }Ì 
function cdr(s: Sexpr2(t)): Sexpr2(t); 
{pre: se: L{Sli84se ien) hs 1 
posts câr(s) =.L(S82,83, vv, Sn) (A s= L(s1,;sS2, …seysn) )} 
function cons(s1,s2: Sexpr2(t)): Sexpr2(t); 
{pre: s2 = L(lal,a2,...,an) 


post: cone(st,s2) = Lisi, ,äl;a2,...,an)} 
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function atom(s: Sexpr2(t)): boolean; 
pret: true 
post: atom(s) = A(s)} 
function eq(sl,s2: Sexpr2(t)): boolean; 
{pre: A(s1) A A(s2) 
post: eq(st, s2). = (st = s2)} 
function se(s: t)’ Sexpr2(t); 
{pre: true 
post: A(se(s))} 
end; 
implementation Sexpressions2; 
structure Sexpr2(type t) = (atomiec(t),list(lis(t))); 
list(type t) = SimpleList(Sexpr2(t)); 


end; 


In deze implementatie hebben we, in wederzijds recursieve definities, 
gebruik gemaakt van de eerder gedefinieerde structuur SimpleList. 
Een SimpleList van S-expressies wordt een S-expressie via de gene- 
rator List. Zo wordt de lege SimpleList, Sempty, via List de eerder 
bedoelde constante empty: List(Sempty) (= empty). 

De functies car en cdr zijn, zie de definitie, alleen gedefinieerd 
voor niet-atomaire S-expressies die niet 'leeg' zijn. (Dit geldt ook 
bij de vorige definitie van S-expressies.) Het resultaat van de 
functies kunnen we ook in wat eenvoudiger bewoordingen omschrij- 
ven als: 


car : uit een niet-lege rij van S-expressies wordt de eerste 
gekozen 

cdr : uit een niet-lege rij van S-expressies wordt de eerste weg- 
gelaten; wat overblijft is het resultaat 

cons: het eerste argument wordt als eerste element toegevoegd 
aan de rij S-expressies die door het tweede argument 
wordt voorgesteld; uit deze omschrijving zien we (wat we 
ook uit de definitie van de generator Scons bij de type- 
definitie voor SimpleList kunnen halen) dat het tweede 
argument niet-atomair mag zijn. 


Voor de functies car, cdr en cons geldt (ook bij de vorige definitie): 


car(cons(a,b)) = 
edr(cons(a,b)) = b 
cons(car(a),cdr(a)) = a 


De niet-atomaire Sexpr2 is een SimpleList. Dit houdt ook in dat de 
in 9.2 genoemde functies voor SimpleLists ook te gebruiken zijn voor 
Sexpr2's. De daar genoemde functies Head en Tail zijn de functies 
die we zojuist als car en cdr hebben omschreven. 
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We hebben twee definities gegeven voor S-expressies uit LISP. Leve- 
ren de twee definities dezelfde waardenverzameling op? Als dit het 
geval zou zijn, zouden we de twee definities equivalent kunnen noe- 
men. Het kan worden nagegaan dat de definitie van sexpr2 een 
waardenverzameling beschrijft die een echte deelverzameling is van 
de waardenverzameling van sexpr (als we in beide gevallen uitgaan 
van hetzelfde type als argument). Deze uitspraak is alleen geldig 
als we afzien van de waarde List(Sempty) van het type sexpr2. Om 
de uitspraak ook waar te maken inclusief voor deze waarde, is in 
LISP een speciale waarde van het type Sexpr (bij elk basistype) 
ingevoerd: NIL. Deze waarde van het type Sexpr correspondeert 
dan met List(Sempty) van het type sexpr2. 


9,4 DE LIST- EN BOOMSTRUCTUUR 


In 9.3 is de S-expressie op twee manieren geïntroduceerd. Bij de 
tweede vorm, Sexpr2, werd gebruik gemaakt van wederzijdse 
recursie, We vervangen de wederzijdse recursie in de implementatie 
door gewone recursie: 


structure list(type t) = (atomair(t),LSL(SimpleList(list(t)))); 


Een list is dus óf atomair óf het is een SimpleList van lists. De gene- 
rator LSL doet dienst als een type transferfunctie. 
Stel dat het type t het type integer is. Dan zijn 


atomair (3) 
LSL (Scons(atomair(4),Sempty)) 
LSL (Scons(atomair(5),LSL(Scons(atomair(6),Sempty)))) 


en dergelijke, waarden van het type 


type intlist = list(integer); 


Voor de notatie van een waarde van het type list(t) houden we de 
volgende conventie aan: 


atomair(t1) noteren we als t1 
LSL(s) noteren we als s. 


Bijvoorbeeld: atomair(3) noteren we als 3, 
LSL(Secons(atomair(4),Sempty)) als (4), 
LSL (Seons(atomair(5),LSL(Scons(atomair(6) ,Sempty)))) 
als (5,6), en 
LSL(Scons(atomair(5) ,Scons(LSL(Scons(atomair(6), 
Sempty)),Sempty))) als (5,(6)). 
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Dan zijn 3, (4), (5,6), C), (1,2,3), (4,5,(6,7,(8,9),10),( ),11, 
(12,13)) en dergelijke, waarden van het type intlist. Een niet- 
atomaire waarde als (1,(2,3),4,(5,(6,7),8)) zouden we in beeld 
kunnen brengen als 


Als een list niet atomair is, dan is het een SimpleList, dit betekent 
dat alle functies die bij SimpleLists genoemd zijn, ook gebruikt kun- 
nen worden voor niet-atomaire lists. Er geldt bijvoorbeeld dat de 
functies CreateSL, SLIsMT, Head, Tail en ConsSL gebruikt kunnen 
worden (als de abstracte datastructuur SimpleList gedefinieerd is). 
Laten we nog enkele functies bekijken. Allereerst de functie concat, 
die van twee niet-atomaire listst x en y één list maakt die bestaat 
uit de elementen van x gevolgd door de elementen van y. Geven we 
de concatenatie van x en y aan met C, dan geldt voor C: 


C(LSL(Sempty),y) = y 
C(LSL(Scons(a,b)),y) = LSL(Scons(a,C(b,y))) 


Deze eigenschap gebruiken we in: 


function. concaäatfayys Iast(t)): Iast(t}s 

{pre: x en y niet-atomair 

post: concat(x,y) = C(x,y)} 

begin if x = LSL(Sempty) 
then concat := y 
else concat := LSL(ConsSL(Head(x), 

concat(Tail(x),y))) 
end; 


Voor het aantal elementen (van het type list(t)) in een niet-ato- 
maire list geldt 


A(LSL(Sempty)) = 0 
A(LSL(Scons(a,b))) = 1 + A(LSL(b)) 


(vergelijk countel bij SimpleLists). Hieruit kunnen we afleiden: 
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function length(x: list(t)): integer; 
pre: x niet-atomair | 
post: length(x) = A(x)} 
begin if x = LSL (Sempty) 
then length := 0 
else length := f + length(LSL(Tail(x))) 
end ; 


Voor het aantal atomen (waarden van het type t) in een niet-atomaire 
list geldt: 


A'(LSL(Sempty)) = 0 
A'(atomie(x)) = 1 
A'(LSL(Seons(a,b))) = A'(a) + A'(LSL(b)) 


Zo vinden we: 


function noa(x: list(t)): integer; 
{pre: x niet-atomair 


post: noa(x) = A'(x)} 
begin if x = LSL(Sempty) 
then noa := 0 
else case Head(x) of 
atomair(a): noa := 1 + noa(LSL(Tail(x))); 
LSL(b): noa := noa(Head(x)) + noa(LSL(Tail(x))) 
end 
end; ik 


In 9.2 hebben we een functie gezien die uit een SimpleList x een 
nieuwe SimpleList maakt door de elementen van x in omgekeerde 
volgorde te plaatsen in de nieuwe SimpleList; het was de functie 
reverse. Deze functie kan ook gebruikt worden voor niet-atomaire 
lists. Deze functie zouden we, bij gebruikmaking van concat, een 
andere body kunnen geven: 


case x of 
atomair(a): ; 
LSL(b): case b of 
Sempty: reverse s= LSL(Sempty); 
Scons(u,v): reverse := concat(reverse(LSL(v)), 
LSL (Scons(u,Sempty) )) 


end 


end 


Het aantal malen dat de generator Scons (als constructiefunctie) 
wordt gebruikt om een list van n elementen om te keren is ongeveer 
łn?. Het kan voordeliger als we gebruik maken van een accumule- 
rende parameter (zie 9.2). Accumulerende parameters kunnen vaak 
met vrucht gebruikt worden om recursie te versnellen. 
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Nog een laatste functie voor lists. We hebben ons zojuist bezig- 
gehouden met het omkeren van de elementen in een list. We willen 
nu kijken naar een functie die niet alleen de volgorde van de elemen- 
ten omkeert, maar ook elk element van volgorde omkeert. We gaan 
uit van de body van de functie reverse in 9.2 en van de daar 
genoemde eigenschap O. Het verschil met 9.2 is dat een element van 
een list een list kan zijn, die ook van volgorde moet omkeren. Uit de 
functie reverse vinden we dus rechttoe-rechtaan: 


function reversel(x: list(t)): list(t); 
begin case x of 
atomair(a): reversel := atomair(a); 
LSL(b): case b of 
Sempty: reversel := LSL(Sempty); 
Scons(u,v): reversel := append(reversel(u), 
reversel(LSL(v))) 


end 


end; 


Een waarde met een liststructuur (niet-atomair en voor het type t 
het type integer) zouden we kunnen noteren als ((1,2,(3)),4,(5,6)) 
(zie terug). Deze list bestaat uit drie elementen, waarvan het eerste 
element de niet-atomaire waarde (1,2,(3)) is, het tweede element de 
atomaire waarde 4 en het derde element de niet-atomaire waarde 
(5,6). We kunnen een list ook weergeven als een zogenaamde boom. 
Voor het voorbeeld wordt dit: 


((1,2,(3)),4,(5,6)) 


(1,2,(3)) (5,6) 


Elk punt (knooppunt genoemd) stelt een listwaarde voor. Uit elk 
knooppunt vertrekken verbindingen (lijnen) naar de elementen die 
behoren tot de listwaarde van het knooppunt. Er kunnen dus alleen 
lijnen vertrekken uit knooppunten die niet-atomaire waarden voor- 
stellen. Knooppunten waaruit geen verbindingen vertrekken (de 
atomaire waarden) worden wel de bladeren van de boom genoemd en 
de andere knooppunten (de niet-atomaire waarden) de interne 
knooppunten van de boom. Bij bomen die lists voorstellen zijn de 
bladeren dus de representanten van de atomaire waarden en de 
interne knooppunten de representanten van niet-atomaire listwaar- 
den. Er is een bijzondere knoop, waar geen lijnen binnenkomen, 
het is de wortel van de boom. De wortel is de representant van de 
totale listwaarde. 
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We kunnen een boom in het algemeen definiëren als een eindige, 
niet-lege verzameling van elementen, die knooppunten worden 
genoemd, waarvoor geldt: 1) er is een speciaal element dat de wor- 
tel van de boom wordt genoemd, en 2) de andere knooppunten zijn 
verdeeld over n (20) disjuncte deelverzamelingen die weer bomen 
zijn. Zo'n deelverzameling wordt een subboom genoemd bij de betref- 
fende wortel. Bij het tekenen van een boom trekken we een verbin- 
ding die uitgaat van de wortel en die-gaat naar een element van de 
deelverzameling (de wortel van die deelverzameling). Deze wortel 
van de deelverzameling wordt wel een zoon genoemd van de wortel 
(de vader). Bij het tekenen van een boom brengen we wel een volg- 
orde aan tussen de zonen van een vader door de elementen van 
links naar rechts te tekenen. We spreken in zo'n geval van een 
geordende boom. We zullen in het vervolg alleen naar geordende 
bomen kijken (zonder dat we dat steeds vermelden). Een bos is een 
verzameling (niet leeg) van disjuncte bomen. Als we van een boom 
de wortel weghalen, houden we een bos over. 

De elementen van een boom die een list voorstelt zijn listwaarden. 
Maar er is een speciale relatie tussen de listwaarde van een wortel 
en de listwaarden van zijn zonen: de vader is de niet-atomaire list 
waarvan de zonen de elementen zijn. We willen nu deze speciale 
relatie loslaten en voor de elementen van de verzameling (boom) 
willekeurige (niet noodzakelijk verschillende) waarden uit een waar- 
denverzameling nemen. De boom is dan een nieuwe datastructuur, 
die we als volgt kunnen definiëren: 


structure tree(type t) = record root: t; 


forest: SimpleList(tree(t)) 
end; 


We kunnen nu bijvoorbeeld declareren: 


var b: tree(integer); 


Omdat b een record is, kunnen we de twee componenten selecteren: 
b.root (van het type t) en b.forest (van het type SimpleList(tree 
(E))). 

Vaak moet in een algoritme waarin bomen een rol spelen voor alle 
knooppunten van een boom een bepaalde operatie worden uitgevoerd. 
Op een systematische manier moeten dan de knooppunten afgelopen 
worden. Dit kan bijvoorbeeld in de zogenaamde pre-order. De pre- 
order ontstaat door van elke (sub)boom eerst de wortel te nemen en 
daarna - 'van links naar rechts! - de subbomen behorende bij die 
wortel, ook elk weer in de pre-order. Voor de boom met als grafi- 
sche representatie (we laten nu de pijlen verder weg): 
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is de volgorde van de knooppunten bij de pre-order: 1,2,5,6,9,10,3, 
4,7,8. Als we de operatie, die op elk van de knooppunten moet wor- 
den uitgevoerd, aangeven met P, kan het uitvoeren van P voor alle 
knooppunten gerealiseerd worden door een aanroep van: 


procedure preorder(b: tree(t)); 
begin P(b.root); preorderbos(b.forest) end; 


met 


procedure preorderbos(f: SimpleList(tree(t))); 
begin case f of 


Sempty: ; 
Scons(a,b): begin preorder(a); preorderbos(b) end 
end 


end; 


De pre-order wordt ook wel de depth-first-order genoemd. Een 
andere systematische manier van aflopen van een boom is het aflopen 
in post-order. De post-order ontstaat door van elke (sub)boom eerst 
de subbomen - 'van links naar rechts! genomen - in post-order te 
doorlopen en daarna de wortel te nemen. Voor de boom op bladzijde 
262 wordt dit: 5,9,10,6,2,3,7,8,4,1, 


In deze paragraaf hebben we geen abstracte datastructuur gedefini- 
eerd. We zullen dit wel weer doen in de volgende paragraaf. 


9.5 BINAIRE BOMEN 


De terminologie rond binaire bomen in de literatuur is soms wat ver- 
warrend. Men spreekt wel van een strikt binaire boom en bedoelt 
daarmee een boom waarvan elk knooppunt twee of geen (strikt 
binaire) subbomen heeft. Deze strikt binaire boom zouden we kunnen 
vastleggen (wat de waardenverzameling betreft) als 
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structure SBT(type t) = (root(t),tree(SBT(t),t,SBT(t))); 


Een ander soort binaire boom is de zogenaamde Knuth binaire boom, 
die bestaat uit een verzameling knooppunten die óf leeg is óf bestaat 
uit een speciaal knooppunt, de wortel, en twee deelverzamelingen 
die Knuth binaire bomen zijn. Deze Knuth binaire boom is de binaire 
boom die in hoofdstuk 5 geïntroduceerd is. We zullen ons verder tot 
deze bomen beperken en ze verder gewoon binaire bomen noemen. 
Deze binaire bomen kunnen we met een recursieve definitie (wat de 
waarden verzameling betreft) vastleggen door: 


structure BinTree(type t) = (Bempty,Bin(BinTree(t),t,BinTree(t))); 


Een waarde met deze structuur noemen we een binaire boom. Een 
binaire boom die niet leeg is (niet de waarde Bempty heeft), 
bestaat uit drie componenten: de linker subboom (wat een binaire 
boom is), de wortel (van het type t) en de rechter subboom (wat 
een binaire boom is). De waarden van het type t zijn de knooppun- 
ten van de boom. Als van een (sub)boom de linker en rechter 
subboom leeg zijn, wordt de wortel van deze (sub)boom een blad 
genoemd. De knooppunten van een binaire boom zijn te verdelen in 
bladeren en interne knooppunten. 

Stel dat we van een gegeven binaire boom het aantal knooppunten 
willen bepalen. Als we dit aantal voor boom b aangeven met A(b), 
dan geldt: 


A(Bempty) = 0 
A(Bin(l,w‚r)) = A(I) +1 + A(r) 


Uit deze recurrente betrekking kunnen we direct de volgende func- 
tie afleiden: 


function aantal(b: BinTree(t)): integer; 
{pre: true 
post: aantal(b) = A(b)} 
begin case b of 


Bempty: aantal := 0; 
Bin(l,w,r): aantal := aantal(l) + 1+aantal(r) 
end 


end; 


Functies die we in hoofdstuk 5 hebben geconstrueerd kunnen we nu 
ook coderen bij de bovenstaande structuurdefinitie. In deze func- 
ties maken we dan steeds gebruik van de speciale case statement. 
We zullen een abstracte datastructuur voor binaire bomen implemen- 
teren, waarna we in de functies niet meer van deze case statement 
gebruik behoeven te maken. Voor de definitie en implementatie 
geven we eerst de specificatie (zie 6.4). 
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specification BinTrees; 

structure BinTree(type t) 

sorts BinTree, t, boolean 

functions 
Create > BinTree 
Constr(BinTree,t,BinTree) > BinTree 
IsEmpty(BinTree) > boolean 
Left(BinTree) > BinTree 
Right(BinTree) > BinTree 
Data(BinTree) > t 

axioms for all l,r € BinTree, w mt Let 
IsEmpty (Create) = true 
IsEmpty(Constr(l,‚w,r)) = false 
Left (Create) = undefined 
Left(Constr(l,w,r)) = 1 
Right(Create) = undefined 
Right (Constr(l,‚w,‚r)) =r 
Data(Create) = undefined 
Data(Constr(l,‚w,r)) =w 

end; 


Als we als programmeergereedschap beschikken over de mogelijkheid 
tot het definiëren van recursieve datastructuren, kunnen we het 
volgende abstracte datatype, passend bij de bovenstaande specifica- 
tie, in ons programma definiëren en implementeren. Het effect van 
de functies is gegeven in de specificatie, we zullen moeten laten zien 
dat de implementatie voldoet aan de axioma's; omdat we voor defini- 
tie van de structuur en voor de implementatie dezelfde recursieve 
structuurdefinitie gebruiken, zijn abstractiefunctie en representatie- 
invariant triviaal. 


definition BinTrees; 
structure BinTree(type t); 
function Create: BinTree(t); 
function Constr(l: BinTree(t); w: t; r: BinTree(t)): BinTree(t); 
function IsEmpty(b: BinTree(t)): boolean; 
function Left(b: BinTree(t)): BinTree(t); 
function Right(b: BinTree(t)): BinTree(t); 
function Data(b: BinTree(t)): t 
end; 
implementation BinTrees; 
structure BinTree(type t) = (Bempty,Bin(BinTree(t),t,BinTree(t))); 
function Create: BinTree(t); 
begin Create := Bempty end; 
function Constr(l: BinTree(t); w: t; r: BinTree(t)): BinTree(t); 
begin Constr := Bin(l,w,r) end; 
function IsEmpty(b: BinTree(t)): boolean; 
begin case b of 
Bempty: Isempty := true; 
Bin(l,w,r): IsEmpty := false 
end 


end; 
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function Left(b: BinTree(t)): BinTree(t); 
begin case b of 
Bempty: ; 
Bin(l,‚w‚r): Left := 1 
end 
end; 
function Right(b: BinTree(t)): BinTree(t); 
begin case b of 
Bempty: ; 
Bin(l,‚w,r): Right := r 
end 
end; — 
function Data(b: BinTree(t)): t; 
begin case b of 


Bempty: ; 
Bin(l,w,r): Data := w 
end 
end 
end; 
Voorbeeld 


We willen de waarde van het array v, gedefinieerd als 


type index = 1..n; 
rij = arraylindex] of t; 
var. Ve rif) 


opnemen in een binaire boom. Dit kan uiteraard op velerlei manieren. 
Welk element van v wordt de wortel van de binaire boom? Welke ele- 
menten worden in de linker subboom opgenomen, welke in de rech- 
ter? En voor de subbomen weer dezelfde vragen. We kiezen er hier 
voor dat het eerste element (index 1) de wortel wordt en dat van de 
resterende waarden de eerste helft in de linker subboom en de 
tweede helft in de rechter subboom terechtkomt. Met B(v,p,q,b) 
geven we aan dat de binaire boom b op de zojuist beschreven wijze 
zijn waarde krijgt vanuit het arraysegment v[p..q]. Voor q< p 
geldt 


B(v,p,q,Create) 
en voor q 2 p geldt: 


B(v,p,q,Constr(l,w,r)) = 
(w=v[p] AB(v‚p+1l,(p+1l+q) div 2,1) {AB(v,(p+1+q) div 2+1,q,r)) 


De binaire boom kan nu 'uit het array! geconstrueerd worden met 
behulp van de functie: 
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function binboom(v: rij; p,q: index): BinTree(t); 
{pre: true 
post: B(v,p,q,binboom(v,p,q))} 
begin if q $ p 
then binboom : 
else binboom : 


Create 

Constr(binboom(v,p, (p+q) div 2), 
vi (pta) div 2+1]; . 
binboom(v,(p+q) div 2. + 2,q2) 


end 


Deze constructie is zodanig dat het resultaat een gebalanceerde 
binaire boom is. Dat wil zeggen dat voor elk knooppunt geldt dat de 
absolute waarde van het verschil tussen het aantal knooppunten in 
de linker subboom van het betreffende knooppunt en het aantal 
knooppunten in de rechter subboom van het betreffende knooppunt 
ten hoogste 1 is. 


Nu de abstracte datastructuur gedefinieerd is, en de implementatie 
- hier met behulp van onze recursieve definitiemogelijkheid - 'ver- 
stopt' is in de implementation module, moeten we de specificatie van 
eigenschappen (B in het voorbeeld) en operaties (binboom in het 
voorbeeld) uitdrukken in de gedefinieerde operaties en niet in 
eigenschappen van de implementatie. Vandaar dat B met Create en 
Constr is gedefinieerd en niet met Bempty en Bin. 


Een binaire boom kan ook hoogte-gebalanceerd zijn. Een hoogte- 
gebalanceerde binaire boom wordt ook wel een AVL-boom genoemd, 
Deze vorm van een binaire boom blijkt voordelen te hebben ten aan- 
zien van efficiëntie bij operaties. 

We definiëren eerst wat de hoogte H(b) van boom b is. We definië- 
ren H(Create) = -1 en H(Constr(l,w‚r)) = 1 + max(H(l),H(r)). Een 
functie voor het bepalen van de hoogte luidt dan: 


function hoogte(b: BinTree(t)): integer; 
{pre: true 
post: hoogte(b) = H(b)} 
var hl,hr: integer; 
begin if IsEmpty(b) 


then hoogte := -1 

else begin hl := hoogte(Left(b)); 
hr := hoogte(Right(b)); 
if hl > hr then hoogte := hl+1 
dt else hoogte := hr +l 


end 
end 


De lokale variabelen hl en hr zijn ingevoerd met het oog op efficiëntie 
(dit is een algemene aanpak bij recursieve datastructuren). Een binaire 
boom is hoogte-gebalanceerd als voor de boom zelf en voor al zijn sub- 
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bomen geldt dat het verschil in hoogte tussen de subbomen van elk 
knooppunt ten hoogste 1 is. Noemen we deze eigenschap HB dan geldt: 


HB(Create) = true 
HB(Constr(l,w,‚r)) = HB(1) A HB(r) A|H(1) - H(r)l < 1 


Als functie voor het bepalen van het al dan niet hoogte-gebalanceerd 
zijn van een binaire boom krijgen we dan: 


function hoogtebalans(b: BinTree(t)): boolean; 

{pre: true 

post: hoogtebalans(b) = HB(b) } 

begin if IsEmpty(b) 

~ then hoogtebalans := true 
else hoogtebalans := hoogtebalans(Left(b)) 
and hoogtebalans(Right(b)) 
and (abs(hoogte(Left(b)) - 
hoogte(Right(b))) < 1) 


end 


Deze aanpak is, door het steeds weer opnieuw bepalen van de 
hoogte, inefficiënter dan nodig is. Deze inefficiëntie kan worden 
opgevangen door een extra (var-) parameter op te nemen voor de 
hoogte. Het is dan netter om een procedure te maken. Deze luidt: 


procedure hoogtebal(b: BinTree(t); var h: integer; var hb: boolean); 

‚pre: true 

post: h = H(b) A hb = HB(b)} 

var hl,hr: integer; 

hbl,hbr: boolean; 
begin if IsEmpty(b) 
then begin h := -1; hb := true end 
else begin hoogtebal(Left(b),hl,hbl); 

{hl = H(1) A hbl = HB(1)} 
hoogtebal(Right(b),hr,hbr); 
{hr = H(r) A hbr = HB(r)} 
if hl/> hr then h s= hl+1 


else h := hr+l; 
{h = H(b)} 
hb := hbl and hbr and abs(hl-hr) < 1 
{hb = HB(b)} 


end 
end 


Iedere binaire boom die gebalanceerd is, is ook hoogte-gebalanceerd; 
het 'omgekeerde' is niet het geval: 
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8 9- -10 11 12 


Stel dat we van een binaire boom de waarden van de knooppunten 
(integers) in pre-order willen afdrukken. Dit kan met behulp van 
de procedure: 


procedure preprint(b: BinTree(integer)); 
begin if not IsEmpty(b) 
then begin write(Data(b)); 
preprint(Left(b)); 
preprint(Right(b)) 
end 
end 


De waarden worden nu in de pre-order afgedrukt. In hoofdstuk 5 
hebben we nog twee andere volgordes leren kennen: de in-order en 
de post-order. 


De binaire boom 
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kunnen we opvatten als een representatie van de aritmetische 
expressie (a +b /c) *(d-e *f). Deze binaire boom hebben we al 
eerder leren kennen. Bij de nu gegeven definitie zou deze boom een 
(representatie van een) waarde van de variabele 


var arb: BinTree(char); 
kunnen zijn. 


Opmerking 


Als we in de binaire bomen voor aritmetische expressies onderscheid 
zouden willen maken tussen de operanden (de bladeren) en de ope- 
ratoren (de interne knooppunten), zouden we uit kunnen gaan van 
de definitie: 


type AETree = (primary(operand), expr(AETree,operator,AETree)); 


waarin de typen operand en operator als gedefinieerde typen worden 
verondersteld. Vergelijk deze definitie met die van BinTree en met 
die van expression uit 9.1. è 


Een veel gebruikte binaire boom, die we ook al zagen in hoofdstuk 5, 
is de zogenaamde binaire zoekboom; deze wordt vooral gebruikt voor 
de implementatie van samengestelde verzamelingen. We gaan uit van 
de definitie van BinTree en nemen als argument een type dat geor- 
dend is (waarvoor de relatie-operatoren gedefinieerd zijn). Voor 
een binaire zoekboom geldt voor elk (intern) knooppunt met waarde 
k dat alle waarden in de linker subboom van het knooppunt kleiner 
zijn dan k en dat alle waarden in de rechter subboom van het knoop- 
punt groter zijn dan k. Laten we de verzameling knooppunten van 
een binaire boom b aangeven met V(b). Voor V geldt: 


V(Create) = 0 
V(Constr(l,w,‚r)) =V(1) U{w} U V(r) 


Voor de eigenschap BZ(b), de binaire boom b is een zoekboom, 
geldt nu: 


BZ(Create) 
BZ(Constr(l,w,‚r)) = BZ(1) a BZ(r) ^ (Ak: k € V(I):k< w) 
Nn CARK RE V(r):k> wW) 


We willen nu nagaan of de waarde e voorkomt in de binaire zoekboom 
b. We geven deze eigenschap aan met E(e,b): 


=E(e,Create) 
E(e,Constr(l,w,‚r)) = (e =w) v E(le,l) v E(e,r) 
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Een functie voor het bepalen of een waarde voorkomt in een binaire 
zoekboom is dan: 


function el(b: BinTree(t); e: t): boolean; 

{pre: BZ(b) (en type t is geordend) 

post: el(b,e) = E(e,b})} 

begin if IsEmpty(b) 

then el := false 
else if e = Data(b) 
~ then el := true 
else if e < Data(b) 

then el := el(Left(b),e) 
else el := el(Right(b),e) 


end 


Dit effect is ook eenvoudig te realiseren met een functie waarbij in 
de body gebruik wordt gemaakt van iteratie. 


function el2(b: BinTree(t); e: t): boolean; 
var bb: BinTree(t); gevonden: boolean; 
begin bb := b; gevonden := false; 
while not IsEmpty(bb) and not gevonden do 
begin if e = Data(bb) 
ben gevonden := true 
else if e < Data(bb) 
then bb := Left(bb) 
else bb := Right(bb) 


end; 


el2 := gevonden 
end 


De complexiteit van deze algoritmen is O(h), waarin h de hoogte van 
de boom is. Als de boom geen zoekboom zou zijn geldt voor de com- 
plexiteit O(n), waarin n het aantal knooppunten van de boom is. 
Hieruit zien we het belang van het (hoogte-) gebalanceerd zijn van 
de binaire zoekboom (want dan geldt h % log n). We zullen er hier 
echter verder geen aandacht aan besteden. 


De volgende procedure is voor het opnemen van een ‘nieuwe! waarde 
in een binaire zoekboom. 
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procedure insert(var b: BinTree(t); e: t); 
“{pre: BZ(b) A V(b) =S 
post: BZ(b) A V(b) = S U {e}} 
begin if IsEmpty(b) 
then b := Constr(Create,e,Create) 
else if e # Data(b) 
~ then if e < Data(b) 
then begin insert(Left(b),e); 
b := Constr(Left(b),Data(b),Right(b)) 


end 
else begin insert (Right(b),e); 
b := Constr(Left(b),Data(b),Right(b)) 
end 
end 


Bij deze procedure wordt geen rekening gehouden met gebalanceerd- 
heid. 


Ten slotte een procedure om een waarde uit een binaire zoekboom te 
verwijderen (zie hoofdstuk 8). 


procedure delete(var b: BinTree(t); e: t); 
{pre: BZ(b) A V(b) =X 
post: BZ(b) A V(b) = X\{e}} 
var bb: BinTree(t); m: t; 
begin if not IsEmpty(b) 
then begin if e = Data(b) 
then if verse aeS and IsEmpty (Right (b)) 
then b := Create 
else if not IsEmpty(Left(b)) and 
IsEmpty (Right (b)) ie, 
then b := Left(b) 
else ifn not IsEmpty(Right(b)) and 
IsEmpty (Left (b)) 
then b := Right(b) 
else begin bb := Right(b); 
removemin (bb,m); 
b := Constr(Left(b),m,bb) 


end 
else if e < Data(b) 
then begin delete(Left(b),e); 
b := Constr(Left(b),Data(b),Right(b)) 
end 
else begin delete(Right(b),e); 
b := Constr(Left(b),Data(b),Right(b)) 
end 
end SRA 
end S 


Ook in deze procedure zouden we lokale variabelen hebben kunnen 
introduceren om alle dubbele aanroepen van bijvoorbeeld Left en 
Right te voorkomen. 

De procedure removemin moet nog gerealiseerd worden, maar we 
zullen deze direct opnemen in de implementatie van de abstracte 
datastructuur voor samengestelde verzamelingen die hieronder volgt. 
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Let wel: we werken hier niet met gebalanceerde binaire zoekbomen. 


implementation setstructure2; 
structure set(type t) = BinTree(t); 
{Abstractiefunctie V 
Representatie-invariant BZ} 
function any(s: set(t)): t; 
{pre: V(s) # Ø 
post: any(s) € V(s)} 
begin any := Data(s) end; 
procedure empty(var s: set(t)); 
{pre: true 
post: V(s) = Ø A BZ(s)} 
begin: s := Create end; 
function isempty (s: set(t)): boolean; 
{pre: V(s) =X 
post: isempty(s) = (X = Ø)} 
begin isempty := IsEmpty(s) end; 
procedure insert(var b: set(t); e: t); 
pre: BZ(b) A V(b) = S 
post: BZ(b) A V(b) = S U {e}} 
a mie os dra 
function el(b: set(t); e: t): boolean; 
{pre: BZ (b) 
post: el(b,e) = E(e,b)} 
ve (ein bpi 276] 
procedure delete(var b: set(t); e: t); 
{pre: BZ(b) A V(b) =X 
post: BZ (b) A V(b) = X{e}} 
vee AEDO De €19) 
procedure removemin (var b: set(t); var min: t); 
{pre: BZ(b) A V(b) # Ø% A b = bg 
post: min = (MINX : x € V(bO) : x) A BZ(b) A V(b) = V(bQ) N {min}} 
var h: set(t); 
begin if not IsEmpty(b) 
then begin if IsEmpty(Left(b)) 
then begin min := Data(b); 
b := Right(b) 


end 
else begin h := Left(b); 
removemin (h,‚min); 
b := Constr(h,Data(b),Right(b)) 
end 
end 


end; 


Voorbeeld 
Stel dat het array v, gedefinieerd als 
type index 1..n; 


rij = arraylindexl of t; 
vat: we rij; | 
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een zodanige waarde heeft dat geldt: 


Abels bijen dj: vlij v) 


De componentwaarden van v kunnen we opnemen in een binaire boom 
b, waarvoor de eigenschap BZ geldt, door de procedure insert van 
pagina 275 te gebruiken. 


var b: BinTree(t); 
empty(b); {BZ (b) } 
for itis T ton do insert(b,vlil) {BZ (b)} 


We kunnen deze waarden nu weer in het array plaatsen. Doen we 
dat volgens de in-order, dan zal het array stijgend gesorteerd zijn. 
Omdat we moeten weten waar de wortel van een (sub)boom geplaatst 
moet worden, moet de grootste index worden bijgehouden die 
gebruikt is voor het plaatsen van een linker subboom. Daartoe voe- 
ren we weer een extra var-parameter in. De procedure wordt dan: 


procedure inorderarray(b: BinTree(t); var v: rij; var g: integer); 


{pre: BZ (b) 
Posts (Alt I s i Sige vlij € vb) A 
(MIGE SAE € gh vile vl IJ} 


begin if not IsEmpty(b) 
then begin inorderarray(Left(b),v,g); 
vlg] := Data(b); g := g+1; 
inorderarray(Right(b),v,g) 
end 
end ze 


en deze wordt aangeroepen met: inorderarray(b,v,g) na de initiali- 
satie g := 1. 


We zouden het expliciet construeren van de binaire zoekboom achter- 
wege kunnen laten en het array kunnen gebruiken voor de represen- 
tatie van de binaire zoekboom. Op basis van dit idee kunnen we de 
volgende procedure construeren: 


procedure sort(var v: rij; p,q: index); 
DEE AELTER 1e SNL i: vld. vl) A 
v[p..al = X[p.-a] 
pont: (AtsJep sd As rek Aarf} A 
vlp..q] is een permutatie van x[p..q]} 
var h: index; 
ve Secta 
begin if p <q 
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then begin s := vl(ptq) div 2]; 
{s is de wortel van de binaire zoekboom} 
'herrangschik de waarden van vlp..ql 
zodanig dat geldt: 
(Eh:p Sh sq: {((vlhl = s) A 
E. (Ai :p&i<h:v[i] < s) A 
(Aish<isag: vlij > s)))'s 
{v[p..h-1] zijn de knooppunten van de 
linker subboom en v[h+1..q] zijn de 
knooppunten van de rechter subboom } 
sort{(v,p;h=-1); 
{v[p..h-1] is de linker subboom} 
sort(v,h+1,g) 
{v[h+1..q] is de rechter subboom} 
end 
end 


De aanroep van deze procedure voor een array x van het type rij 
zal zijn: sort(x,l,n). 

Deze sorteerprocedure, die we afgeleid hebben uit het gebruik 
van de binaire zoekboom ten behoeve van het sorteren van een 
array, is de bekende quicksort. In de preconditie staat nu echter 
dat alle waarden in het array verschillend moeten zijn (deze voor- 
waarde is nog afkomstig van de binaire zoekboom). Als de precon- 
ditie true moet zijn (nog steeds geldt wel dat het type t geordend 
is) zoals bij quicksort, wat moet er dan in de procedure veranderen? 

Voor het herrangschikken kunnen we gebruik maken van het 
algoritme dat bekend staat onder de naam 'Dutch National Flag' 
(zie bij sorteren) 


Voorbeeld 
De gelijkvormigheid (isomorfie), aangegeven met t1 t2, van twee 
binaire bomen is gedefinieerd als: 

t œ Create e t = Create 

Create = tet = Create 


Constr(tl,x,t2) =» Constr(ul,y,u2) e 
(x =y) A ((ti>ul a t2 u2) v 
(tl> u2 a t2e=ul)) 


De onderstaande binaire bomen zijn isomorf: 


1 PE 
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Een functie voor het bepalen of twee binaire bomen isomorf zijn kan 
dan luiden: 


function isomorf (bl,b2: BinTree(t)): boolean; 
{pre: true 
post: isomorf (b1,b2) = (b1 œ b2)} 
begin if IsEmpty(b1) or IsEmpty(b2) 
then isomorf := (IsEmpty(bl) and IsEmpty(b2)) 
else isomorf := (Data(b1) = Data(b2)) and 
((isomorf(Left(bl),Left(b2)) 
and isomorf (Right(bl),Right(b2))) 
or (isomorf(Left(bl),Right(b2)) 
and isomorf (Right(b1),Left(b2)))) 


end 


Daarnaast kennen we ook het begrip permutatie-isomorf: alle binaire 
bomen van de vorm 


met een permutatie van de waarden 1,2,3,4,5,6 over de knooppun- 
ten, zijn permutatie-isomorf. Als a en b permutatie-isomorf zijn, 
geven we dat aan met P(a,b) (er geldt dat er 


1 -2n 
n (2) 
niet permutatie-isomorfe binaire bomen met n waarden zijn). 


De heapvoorwaarde HVW(t) voor een binaire boom t is gedefinieerd 
als: 


HVW(Create) 
HVW(Constr(l,w,r)) = HVW(1) a HVW(r) A 
w< MIN(l)a w< MIN(r) 


waarin MIN(t) staat voor het minimum van de waarden in t (met 
MIN (Create) = + œ), 
We construeren eerst een functie sift waarvoor geldt: 


{HVW(t1) A HVW(t2)} 
sift(ti, t2, W) 
{P(sift(t1,t2,w),Constr(t1,w,t2)) A HVW(sift(t1,t2,w))} 
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en dan een functie MakeHeap met 


{true} 
bt := MakeHeap(b) 
{P(b‚bt) A HVW (bt) } 


function sift(tl,t2: BinTree(t); W: t): BinTree(t); 
{pre: HVW(t1) A HVW(t2) 
post: P(sift(t1,t2,w),Constr(ti,w,t2)) A HVW(sift(t1,t2,w)) } 
begin if IsEmpty(ti) and IsEmpty(t2) 
then sift := Constr(Create,w,Create) 
else if IsEmpty(tli) 
— then if w <= Data(t2) 
“then sift := Constr(Create,w,t2) 
else sift := Constr(Create,Data(t2), 
sift(Left(t2),Right(t2) ,w)) 


else if IsEmpty(t2) 
then if w <= Data(t1) 
then sift := Constr(tl,w,Create) 
else sift := Constr(sift(Left(t1), 
Right(t1),w),Data(t1),Create) 
else if (w <= Data(t1)) and (w <= Data(t2)) 
then sift := Constr(t1,w,t2) 
else if Data(tl) < Data(t2) 
then sift := Constr(sift(Left(t1), 
Right(t1),w),Data(ti),t2) 
else sift := Constr(t1,Data(t2), 


sift(Left(t2),Right(t2),w)) 
end; 


function MakeHeap(b: BinTree(t)): BinTree(t); 
pre: true 
post: P(b,MakeHeap(b)) A HVW (MakeHeap (b) ) } 
begin if IsEmpty(b) 
then MakeHeap := Create 
else MakeHeap := sift(MakeHeap(Left(b)), 
MakeHeap (Right (b)), 
Data(b)) 
end 


Het aantal aanroepen van MakeHeap voor een boom b met n knooppun- 
ten is O(n); het aantal aanroepen van sift voor een boom bb met 
H(bb) als hoogte is O(H(bb)). Totaal: O(n *H(b)). 

Het is ondertussen wel duidelijk dat we de sortering via de 
heapsort aan het bekijken zijn voor binaire bomen. Voor we zover 
zijn definiëren we eerst nog een extra begrip. 

We definiëren de ascending merge, AM(t1,t2), van twee binaire 
bomen als: 


AM(Create,t) =t 
AM(t,Create) =t 


AM(Constr(l1,wl,r1),Constr(12,w2,r2)) = 
Constr(AM(I1,r1),wl1,Constr(12,w2,r2)) voor wl 
Constr(Constr(l1,wl,rl),w2,AM(12,r2)) voor w1 


Recursieve datastructuren 


Er gelden: 


HVW(EI) a HVW(t2) > HVW(AM(t1,t2)) 
H(AM(t1,t2)) < 1 +max(H(t1i),H(t2)) 


We construeren nu de functie Rep met 


{t = Constr (l,w,r) } 
Cr 3 


function Rep(b: BinTree(t)): BinTree(t); 

{pre: IsEmpty (b) 

post: Rep(b) = AM(Left(b),Right(b))} 

begin if IsEmpty(Left(b)) 

~ then Rep := Right(b) 
else if IsEmpty(Right(b)) 

-athen Rep := Left(b) 
else if Data(Left(b)) < Data(Right(b)) 
then Rep := Constr(Rep(Left(b)), 


Data(Left(b)), 
Right(b)) 

else Rep := Constr(Left(b), 
Data(Right(b)), 
Rep(Right(b))) 


end 
Als we met C het aantal aanroepen van Rep aangeven, dan geldt: 


C(Constr(Create,w,‚r)) = 
C(Constr(l,w,Create)) = 1 
C(Constr(l,w‚r)) < 1 + max(C(1), SER 
C(b)< H(b) 


Als we nu n (n 2 1) getallen moeten sorteren, dan kan dat als volgt: 


'zet de getallen in hoogte-gebalanceerde binaire boom b'; 
{HB(b) ^ N(b) 2 1} 
b := MakeHeap(b); 
{HB(b) A N(b) 2 1 A HVW(b)} 
while not IsEmpty(b) do 
begin in {HB(b) A HVW(b) A N(b) 2 1} 
write(Data(b)); 
b := Rep(b) 
{HB(b) A HVW(b) } 


end 


Wat we zo gevonden hebben is de heapsort. Ook hier zien we weer 
het belang van hoogte-gebalanceerde bomen. 
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Als implementatie van de boomstructuur hebben we genomen (blad- 
zijde 265): 


structure tree(type t) = record root: t; 
forest: SimpleList(tree(t)) 
end; 


en voor de (Knuth) binaire boomstructuur (bladzijde 266): 


structure BinTree(type t) = (Bempty,Bin(BinTree(t),t,BinTree(t))); 


De binaire boom is geen speciaal geval van de boom, want: 


- de boom bevat altijd ten minste één knooppunt en elk knooppunt 
heeft 0 of meer subbomen; 

- de binaire boom kan leeg (Bempty) zijn en elk knooppunt heeft 2 
subbomen (die Bempty kunnen zijn). 


Toch is er een verband tussen een boom en een binaire boom, of 
preciezer gezegd, tussen het forest van een boom en een binaire 
boom. Met een leeg bos (Sempty) correspondeert de lege binaire 
boom (Bempty). Als we de SimpleList van bomen aangeven met 
(B1,B2,B3,...,Bn), met n 21, dan correspondeert hiermee de 
binaire boom BB waarvoor geldt: 


- de wortel van BB is de wortel van Bj; 

- de linker (binaire) subboom van BB correspondeert (op de hier 
beschreven wijze) met het bos (de SimpleList) van Bj; 

- de rechter (binaire) subboom van BB correspondeert (op de hier 
beschreven wijze) met het bos (B1,B2,...,Bn). 


Zo komt het bos van de boom 
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overeen met de binaire boom boven aan bladzijde 283. De correspon- 
dentie tussen (het bos van) een boom en de binaire boom kan 
gebruikt worden om bomen te implementeren. Een binaire boom is 
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redelijk eenvoudig te implementeren. Dit geldt niet voor een alge- 
mene boom, Via de correspondentie is ook deze implementatie nu 
niet zo moeilijk meer. 


9.6 IMPLEMENTATIE VAN RECURSIEVE TYPEN 
EN STRUCTUREN 


Als we in een taal niet beschikken over de mogelijkheid om recur- 
sieve typen (en structuren) te definiëren, zoals in dit hoofdstuk is 
gebeurd, dan moeten we deze recursieve type(structuur)definitie 
implementeren (simuleren). Hierbij kan dankbaar gebruik worden 
gemaakt van pointers. 

In 9.2 werd het type SimpleList geïntroduceerd: 


type SimpleList = (Sempty,Scons(basistype,SimpleList)); 


Deze typedefinitie gaan we nu implementeren (simuleren) met behulp 
van pointers. Dit betekent dat we een ‘andere! waarden verzameling 
zoeken dan die, die hoort bij de bovenstaande definitie, en een 
abstractiefunctie, die van een waarde van het andere type aangeeft 
welke waarde van het te implementeren type daarbij hoort. 

We gaan uit van 


type ImSL = telement; 


met 
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type element = record w: basistype; 
p: telement 
end; 


Het type ImsL kunnen we gebruiken voor het implementeren van het 
type SimpleList,. De abstractiefunctie A: ImSL > SimpleList definië- 
ren we als: 


A(nil) = Sempty 
A(r) = Scons(r+.w‚,A(rt.p)) 


De functies die gedefinieerd zijn voor het type SimpleList zijn 
rechttoe-rechtaan om te zetten naar functies voor het type ImSL. 
Als voorbeeld nemen we de functies countel en append uit 9.2 (zie 
daar voor de pre- en postcondities). Voor countel krijgen we nu: 


function Imcountel(sl: ImSL): integer; 


{pre: A(sl) =$ 
post: Imcountel(sl) = countel(s)} 
begin if sl = nil 
“then Imcountel := 0 
else Imcountel := 1 + Imcountel(slt.p) 
end 


En voor append: 


function Imappend(x: basistype; sl: ImSL): ImSL; 
pre: Alsl) = $ 
post: A(Imappend(x,sl) = append(x,s) } 
var r: TmSL; 
begin if sl = nil 
then begin new(r); rt.w := x; rf.p := nil; 
Imappend := r 


end 
else begin new(r); rî.w := sSIft.w; 
rît.p := Imappend(x,slft.p); 
Imappend := r 
end 
end 
Opmerking 


Bij het gebruik van pointers om andere typen te implementeren, 
moeten we oppassen dat we niet gebruik maken van de specifieke 
mogelijkheden van pointers, daar waar dat niet mag. Stel dat het 
type SimpleList niet assigneerbaar is (dat het assignment op het 
niveau van een totale waarde niet gedefinieerd is). Dan moeten we 
een toekenning realiseren met behulp van een functie als: 
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function copy(sl: SimpleList): SimpleList; 

{pre: true 

post: copy(sl) = sl} 

begin case sl of 
Sempty: copy s= Ssempty; 
Sscons(a,b): copy := Scons(a,copy(b)) 

end 
eneen 


Als nu x de waarde van y moet krijgen kan dat via de aanroep 

x := copy(y). Als voor de implementatie geldt dat A(px) = x en 
A(py) =y, dan is, omdat voor de pointers px en py wel de assign- 
ment statement beschikbaar is, de verleiding groot om de waarde- 
toekenning te realiseren via px := py. De functie rmcopy zou dan 
worden: 


function Imcopy(sl: ImSL): ImSL; 
pre: true 
post: Imcopy (sl) = sl} 
begin Imcopy := sl end; 


en de aanroep: px := Imcopy(py). Maar dan zijn na de aanroep px 
en py niets anders dan verschillende namen voor dezelfde SimpleList. 
Elke verandering in de (implementatie van de) SimpleList behorende 
bij px is dan een verandering in de (implementatie van de) Simple- 
List behorende bij py. e 


Het type SimpleList hebben we door middel van een recursieve type- 
definitie gedefinieerd als een waardenverzameling, niet als een 
waardeverzameling plus standaardoperaties. Daarom moeten we bij 
een implementatie (simulatie) de operaties in de vorm van functies 
(de voorbeelden countel en append) opnieuw vastleggen met andere 
functies (Imcountel en Imappend). Bovendien is er het gevaar dat 
gebruik wordt gemaakt van specifieke eigenschappen van de imple- 
mentatie, zoals we gezien hebben bij de assignment. Deze problemen 
doen zich niet voor als we in een definitie niet alleen de waarden ver- 
zameling vastleggen, maar ook de standaardoperaties en ons daarna 
in het programma alleen bedienen van deze standaardoperaties. 
Anders gezegd: als we een abstract datatype creëren. We zullen dat 
nu doen voor binaire bomen. We gaan daarbij uit van de specificatie 
zoals die in 9.5 is gegeven. 

Bij deze specificatie hebben we in 9.5 een definitie en een imple- 
mentatie gegeven. De definitie hoeven we niet te veranderen, alleen 
de implementatie. 
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implementation BinTrees; 


structure BinTree(type t) = 
structure knoop(type s) = 


‘knoop (t); 
record w: sS; 


l, r: Aknoop(s) 


end; 


{De structure knoop is 'verborgen' voor de 'buitenwereld'. 
De relatie tussen de recursieve definitie en de boven- 
staande met pointers zouden we kunnen aangeven met de 
abstractiefunctie B: 


B(nil) = Bempty 
B(k) = Bin(B(k#.1),kt.w,B(kt.r))} 
function Create: BinTree(t); 
begin Create := nil end; 
function Constr(a: BinTree(t); b: t; 
c: BinTree(t)): BinTree(t); 
var p: BinTree(t); 
begin new(p); pt.l := a; pt.w := b; pt.r : 
Constr := p 
end; 
function IsEmpty(b: BinTree(t)): boolean; 
begin IsEmpty := (b = nil) end; 
function Left(b: BinTree(t)): BinTree(t); 
begin. if b $> nil then Left := bt.l end; 
function Right(b: BinTree(t)): BinTree(t); 
begin if b <> nil then Right := bt.r end; 
function Data(b: BinTree(t)): t; in te 
begin if b <> nil then Data := bt.w end 


C? 


end; 


Willen we bij de implementatie een speciale eigenschap eisen, bij- 
voorbeeld dat het bij de bovenstaande structuren handelt om binaire 
zoekbomen, dat moeten we deze eigenschap vastleggen in een repre- 
sentatie-invariant (voor binaire zoekbomen de eigenschap BZ, zie 
terug). | 

Als we nu andere operaties gaan realiseren, maakt het geen ver- 
schil of we dat doen uitgaande van de eerste structuurimplementatie 
of van de tweede. Neem de functie el voor binaire zoekbomen. Deze 
wordt (bij beide implementaties; zie ook bladzijde 274): 


function el(b: BinTree(t); e: t): boolean; 
{pre: BZ(b) (en type t is geordend) 
post: el(b‚e) = E(e,b); voor E zie 9.5} 
begin if IsEmpty(b) 


then el := false 
else if e = Data(b) 
~ then el := true 
else if e < Data(b) 
then el := el(Left(b),e) 
else el := el(Right(b),e) 


end 
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Tot slot bekijken we nog eens het verschil tussen het gebruik van 
de abstracte datastructuur (dus inclusief operaties), de recursieve 
typedefinitie (zonder operaties) en de typedefinitie met pointers 
(zonder operaties). Daarvoor nemen we de functie voor het toevoegen 
van een waarde aan een (niet-gebalanceerde) zoekboom. Allereerst 
de binaire boom als abstracte datastructuur waarvoor BZ geldt. 


function insertl(b: BinTree(t); e: t) BinTree(t); 


pre: BZ (b) 
post: E(le,inserti(b,e)) A BZ(inserti(b,e)); voor E zie 9.5} 
begin if IsEmpty(b) 
then inserti1 := Constr(Create,e,Create) 
else if ë = Data(b) 
then inserti := b 
else if e < Data(b) 
then inserti := Constr(inserti(Left(b),e), 
Data(b),Right(b)) 
else inserti := Constr(Left(b),Data(b), 
insertl1(Right(b))) 
end 


Om dubbele aanroepen van de standaardfuncties te voorkomen, had- 
den we enkele lokale variabelen kunnen introduceren. 

Vervolgens de binaire boom gedefinieerd met een recursieve 
typedefinitie. 


function insert2(b: BinTree(t); e: t): BinTree(t); 
{pre: BZ (b) 
post: E(e,‚insert2(b,e)) A BZ(insert2(b,e)) } 
begin case b of 
Bempty: insert2 := Bin(Bempty,e,Bempty); 
Bin(l,‚w,r): if e = w 
“then insert2 := b 
else if e < w 
“then insert2 : Bin(insert2(l,e),w‚r) 
else insert2 := Bin(l,w,insert2(r,e)) 


end 


end 


En tot slot deze recursieve typedefinitie geïmplementeerd (gesimu- 
leerd) met pointers. 


function insert3(b: BinTree(t); e: t): BinTree(t); 

{pre: BZ (b) 

post: Ele,insert3(b,e)) A BZ(insert3(b,e)) } 

var p: BinTree(t); 

begin if b = nil 

< then begin new(p); pt.w := e; pt.l := nil; pt.r := nil; 
insert3 := p 
end {B A BZ} 
else begin new(p); pt.w := bt,w; 

if e = bt.w 
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then begin pt.r := copy(bt.r); 
pt.l := copy(bt.1) 
{B en BZ voor pt.r en pt.1} 
end 
else if e < bt‚w 
then begin pt.r := copy(bt.r); 
pt.l := insert3(bt.l,e) 
{B en BZ voor pt.r en pt.l} 


end 
else begin pt.r := insert3(bt.r,e); 
pt.l := copy(bt.l) 
{B en BZ voor pt.r en pt.1l} 
end; 


insert3 := p {B en BZ voor insert3} 
end 
end 


De functie copy kopieert zijn argument (de voorstelling van de 
binaire boom waar het argument, een pointer, naar wijst) en geeft 
als resultaat een verwijzing naar deze kopie, We kunnen het kopië- 
ren vermijden als we alleen als assignments toestaan 

q := insert3(q,‚e) en niet bijvoorbeeld r := insert3(g,e). In dit 
geval zouden we operaties zoals insert3 kunnen schrijven als pro- 
cedures, waarbij bijvoorbeeld voor insert3 de heading wordt: 


procedure insert3(var b: BinTree(t); e: t); 


De functie insert1 krijgen we ongeacht de wijze van implementatie 
van de abstracte datastructuren. Alle in dit hoofdstuk geïntrodu- 
ceerde recursieve typen kunnen we, als recursieve definities niet 
zijn toegestaan, implementeren met behulp van pointers. 


Opmer king 


Bij bepaalde operaties op sets kunnen sets geïmplementeerd worden 
als binaire bomen. Binaire bomen kunnen we implementeren met 
pointers (zoals in Pascal) of, als de taal die mogelijkheid zou heb- 
ben, via een recursieve definitie. De recursieve definitie verdient 
de voorkeur omdat daarmee de totale waarde voorgesteld wordt, en 
niet alleen één component ervan zoals dat bij pointers gebeurt. 
Pointers zijn dus niet te prefereren bij ‘regelmatige! structuren 
(zoals sequences, binaire bomen en dergelijke) omdat daar de recur- 
sieve definitie een betere mogelijkheid biedt. Pointers blijven wel 
aantrekkelijk voor het realiseren van ‘onregelmatige! structuren. 
Een bepaald type (structuur) A (bijvoorbeeld set) zou geïmple- 
menteerd kunnen worden met behulp van een type (structuur) B 
(bijvoorbeeld binaire bomen), dat (die) op zijn beurt te realiseren 
is met behulp van C (bijvoorbeeld pointers). Het kan zijn dat A ook 
direct in C is uit te drukken. Welke wijze gekozen wordt zal afhan- 
kelijk zijn van het op te lossen probleem. Vaak zal de weg via het 
‘tussenniveau' B de voorkeur verdienen uit overwegingen van dui- 
delijkheid en het 'gelaagd' oplossen van problemen. Echter, de 
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rechtstreekse weg van A naar C kan toch de voorkeur krijgen op 
grond van efficiëntie-overwegingen. 


S7 


OPGAVEN 


1. Gedefinieerd zijn: 


type constant = integer; 
variable = (a,b,c,d); ; 
operator = (+,*); {kan niet in Pascal} 


binexp = (const (constant), vari(variable), 
bine(binexp,operator,binexp)); 


Voorbeelden van waarden van het type binexp zijn (generatoren 
weggelaten): 


15 

a 
(2,*,(15,+,12)) 
((a,‚*,3),*,1) 
(b,+,0) 


Deze expressies kunnen vereenvoudigd worden tot: 
15 


a 
54 
(a, *,3) 
b 


De vereenvoudigingsregels die toegepast kunnen worden zijn: 


1. Als b1 en b2 de argumenten van een binexp (van de soort 
bine) constanten zijn, dan wordt de binexp vereenvoudigd 
tot het gehele getal dat de uitkomst van de expressie is. 

2. Voor elke expressie geldt dat de binexp's (1,*,e), (e,*,1), 
(0,+,e) en (e,+,0) worden vereenvoudigd tot e, en de 
binexp's (0,*,e) en (e,*,0) tot 0. 


Gevraagd: Construeer de volgende functies: 
l1. function con(s: binexp): boolean; 


die true aflevert als s een constante is, en anders false. 
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2. function var(s: binexp): boolean; 

die true aflevert als s een variabele is, en anders false. 
3. function bin(s: binexp): boolean; 

die true aflevert als s een bine is, en anders false. 
4. function simple(s: binexp): binexp; 


die de meest vereenvoudigde vorm van s aflevert, volgens de 
boven gegeven regels. 


De onderstaande vraagstukken 2 t/m 6 maken gebruik van het type 
SimpleList gedefinieerd als: 


type SimpleList = (Sempty,Scons(Integer,SimpleList)) 


2. Met S(I) geven we de som aan van de integer waarden die in een 
waarde 1 van het type SimpleList voorkomen. 


a. Geef een formele definitie van S. 
b. Maak een functie die voor een argument 1 van het type 
SimpleList de waarde S(1) bepaalt. 


3. Met M(I) geven we het maximum aan van de integer waarden die 
in een waarde 1 (1 # Sempty) van het type SimpleList voorkomen. 


a. Geef een formele definitie van M. 
b. Maak een functie die voor een argument 1 (1 f Sempty) van het 
type SimpleList de waarde M(1) bepaalt. 


4. Maak een functie die bepaalt of een gegeven integer in een gege- 
ven SimpleList voorkomt. 


S. SimpleLists kunnen gebruikt worden om sequences voor te stel- 
len.’ Het verband wordt gegeven door de volgende functie R: 


R(Sempty) = ( ) 

R(Scons(i,l)) = (i) * R(1) {~ staat voor concatenatie} 

Maak een functie append die aan de volgende specificatie voldoet : 
R(Append(l1,12)) = R(11) ~ R(12) 


6. We noemen een SimpleList l increasing als de sequence R(1) 
increasing is. Maak een functie die voor twee increasing 
SimpleLists 11 en 12 het aantal gemeenschappelijke integers 
bepaalt. 
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1. Geef een abstracte datastructuur voor de SimpleList-structuur 
met de operaties CreateSL, SLIsMT, ConsSL, Head en Tail. 
Gebruik voor de implementatie: 


a. recursieve definitie van de structuur; 
b. pointers; 
C. sequences. 


8. Gebruik de abstracte datastructuur uit opgave 7 bij het oplossen 
van de opgaven 2 en 3. 


9. Schrijf abstracte datastructuren voor de twee soorten S-expres- 
sies, waarbij niet van de recursieve typedefinitiemogelijkheid 
gebruik mag worden gemaakt (wel eventueel van pointers). 


10. Schrijf de functie reverse uit 9.4, waarbij gebruik wordt gemaakt 
van een accumulerende parameter. 


De onderstaande vraagstukken (11 t/m 13) maken gebruik van het 
type Bintree, gedefinieerd als 


type Bintree = (Bempty,Bin(Bintree, Integer,Bintree)) 


11. Met P(t) geven we het aantal positieve integer waarden aan dat 
in een waarde t van het type Bintree voorkomt. 


a. Geef een formele definitie van P. 
b. Maak een functie die voor een argument t van het type Bintree 
de waarde P(t) bepaalt. 


12. Bepaal voor een Bintree t (t + Bempty) het gemiddelde van de in 
t voorkomende waarden. 


13. Bepaal voor een Bintree t de Bintree die uit t verkregen wordt 
door in iedere niet-lege deelboom de wortel te vervangen door de 
som van de waarden in die deelboom. 


14. Los de vraagstukken 11 t/m 13 op als de binaire boom als 
abstracte datastructuur gegeven zou zijn. 


15. Gegeven zijn de volgende typedefinities : 


type SimpleList = (Sempty,Scons(Integer,SimpleList)) 
Bintree = (Bempty,Bin(Bintree, Integer,Bintree)) 


SimpleLists kunnen gebruikt worden om rijen integers voor te 
stellen. Het verband wordt gegeven door de volgende abstractie- 
functie R: SimpleList > Integer* 


1. R(Sempty) = ( ) 
2. R(Scons(i,l)) = (i)-~ R(l) {» staat voor concatenatie} 


Ook Bintrees kunnen gebruikt worden om rijen integers voor te 
stellen. Het verband wordt gegeven door de volgende abstractie- 
functie: T: Bintree > Integer*, die overeenkomt met een 'inorder 
traversal': 
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3. T(Bempty) = () 
4 PDI EI, Ot PIEL) S (T) N TEZ) 


Gevraagd wordt een functie h met heading 

function h(t: Bintree): SimpleList; 
die voldoet aan de volgende specificatie: 
3. R(h(E)) = rit) 
In woorden uitgedrukt: de SimpleList h(t) representeert dezelfde 
rij integers als de Bintree t. 
De functie h mag gebruik maken van de hulpfunctie Append, die 
voldoet aan de specificatie: 
6. R(Append(l1,12)) = R(11) ~ R(12) 
1€. Het type ctree is gedefinieerd als: 

type ctree = (leaf(integer),node(ctree,ctree)); 
Waarden van dit type kunnen beschouwd worden als binaire bomen 
die alleen in de bladeren waarden van het type integer bevatten. 
Een pad van de wortel naar een blad kan gekarakteriseerd worden 
door een rij nullen en enen: een 0 correspondeert met een linker 


subboom, een 1 met een rechter subboom. Zo wordt in onder- 
staande boom het pad naar het blad 13 aangegeven door de rij 100: 


13 


Voor de representatie van de rij nullen en enen kan gebruik wor- 
den gemaakt van het type SimpleList, gedefinieerd als: 


type SimpleList = (Sempty,Scons(integer,SimpleList)) 


a. Maak een procedure die voor een gegeven rij r en boom t de 
waarde in het bijbehorende blad bepaalt. Daarbij mag ervan 
uit worden gegaan dat r inderdaad een pad naar een blad van 
t karakteriseert. 
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17. 


18. 


b. Maak een procedure die bepaalt of een gegeven geheel getal a 
in een blad van de boom t voorkomt en die, indien dat het 
geval is, tevens het pad naar zo'n blad bepaalt. 


Geef van beide procedures eerst een formele specificatie. 


We beschouwen logische expressies, opgebouwd uit al dan niet 
ontkende variabelen (als a een variabele is, is ~a de ontkenning) 
en uit de connectieven ^, v en >. Dergelijke expressies kunnen 
gerepresenteerd worden door middel van waarden van het type 
Expr, dat is gedefinieerd als 


type Expr = (Var(Name),Nvar(Name),And(Expr,Expr), 
Or(Expr,Expr),Imp(Expr,Expr)); 


waarbij het type Name bekend verondersteld wordt. 
Zo is bijvoorbeeld de waarde 


Imp(And(var(a),Nvar(b)),Vvar(c)) 
een representatie van de expressie 
(aa ab) sc 
Gevraagd wordt een 
function neg(e: Expr): Expr 


zodanig dat neg(e) een representatie is van de ontkenning van de 
door e gerepresenteerde expressie. 


Binaire zoekbomen kunnen voorgesteld worden met behulp van 
records van het type B, gedefinieerd als: 


type B = record waarde: integer; 
aantal: integer; 
ijr $AB 
end; 


waarbij het veld aantal aangeeft hoe vaak de waarde voorkomt. 
Geef een abstract datatype (lettend op a, b en c). 


a. Maak een procedure die een getal aan een zoekboom toevoegt. 

b. Maak een procedure die alle in een zoekboom voorkomende 
waarden met hun multipliciteit afdrukt. 

c. Gegeven is een invoerrij van positieve getallen, gevolgd door 
een 0. Maak een programma dat met behulp van een zoekboom 
en bovenstaande procedures de in de rij voorkomende positieve 
getallen met hun multipliciteit afdrukt. 


10 GRAFEN 


10.1 INLEIDING 


Informeel gesproken is een (ongerichte) graaf een eindige verzame- 
ling punten (ook wel knopen genoemd), waarvan een aantal verbon- 
den is door lijnen (ook wel zijden of takken genoemd); een gerichte 
graaf is dan een eindige verzameling punten, waarvan er een aantal 
verbonden is door pijlen. De terminologie suggereert al dat grafen 
vaak getekend worden als punten en lijnen (pijlen) tussen deze 
punten. 

Grafen zijn wiskundige structuren die in tal van problemen als 
model kunnen worden gebruikt. Een wegenkaart kan opgevat wor- 
den als een graaf waarbij de plaatsen de punten zijn en de wegen de 
zijden. De plattegrond van een stad, waarbij is aangegeven in welke 
straten eenrichtingsverkeer bestaat, kan opgevat worden als een 
gerichte graaf, met als punten de kruispunten van de straten en de 
straten als de pijlen (tweerichtingsstraat: twee pijlen, één voor elke 
richting). Een telefoonnet kan worden opgevat als een graaf (pun- 
ten: centrales, abonnées; zijden: verbindingen), een digitale scha- 
keling (punten: logische functies als and en or; zijden: verbindin- 
gen), een cursusschema (punten: cursussen; pijlen: verplichte 
voorkennis), etcetera. Vanwege de analogie met (elektrische) net- 
werken worden grafen ook wel netwerken genoemd. 


Een (enkelvoudige) graaf G = (P,Z) bestaat uit een (eindige) niet- 
lege verzameling P, waarvan de elementen punten worden genoemd, 
en een (eindige) verzameling Z, waarvan de elementen zijden worden 
genoemd. Een element z € Z is een verzameling van twee elementen 
van P: z = {pi,pj} met pi € Pen pj € Pen i#j(Z is een verzame- 
ling van ongeordende paren van elementen van P, waarbij de twee 
elementen van het paar verschillend zijn). 

Een graaf kan worden weergegeven door de punten en de zijden 
tussen de punten te tekenen. Zo kan de graaf G = (P,Z) met 
P ={1,2,3,4,5} en Z={{1,2},{1,3},{1,4},{4,5},{2,4},{3,5}} getekend 
worden als: 


Grafen 


of als 


Bij een gerichte graaf G = (P,Z) is Z een (eindige) verzameling 
geordende paren (a,b) met a € P en b € Pena £b. Uit het geor- 
dend zijn volgt dat (a,b) Ł (b,a). Men spreekt ook wel van georiën- 
teerde graaf in plaats van gerichte graaf. 

Ook een gerichte graaf kunnen we tekenen. Zo kan de gerichte 
graaf G = (P,Z) met P = {1,2,3,4}en Z = {(1,2),(2,1),(3,2),(3,4), 
(4,3),(1,3),(1,4)} getekend worden als 


De gerichte graaf (P,Z) met 


P: alle deelverzamelingen van {1,2}, 
Z: (a,b) met ac b (a is een echte deelverzameling van b), 


kunnen we tekenen als 
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Een derde voorbeeld met: 


P = {a,b,c}, 
Z ={(a,b),(b,c),(c,b)} : 


Er geldt dus voor Z: Z c P x P, Hieruit zien we direct al waarvoor 
grafen gebruikt worden: het vastleggen van (binaire) relaties. 


Grafentheorie is ontstaan door het bestuderen, door de wiskundige 
Euler, van het probleem van de bruggen van Königsberg. In de 
rivier lagen daar twee eilandjes en er waren zeven bruggen: 


Grafen 


De vraag was: Bestaat er een mogelijkheid om een wandeling te 
maken waarbij de zeven bruggen elk precies één keer gepasseerd 
worden? Het model is: 


C 


Let wel: dit is geen graaf volgens onze definitie, want de zijde 
{A,C} bijvoorbeeld komt twee maal voor (en wij hebben Z als een 
verzameling gedefinieerd! ). 


Soms laat men de eis van de eindigheid van P en Z vallen. In dat 
geval hebben we te maken met een oneindige graaf. Wij zullen hier 
alleen eindige grafen beschouwen. Ook laat men wel eens de eis val- 
len dat de twee punten, die samen een element van Z vastleggen, 
verschillend moeten zijn. Daardoor is een zijde als 


toegestaan. Ook neemt men bij een ongerichte graaf voor Z wel eens 
een collectie (geen verzameling) van ongeordende paren, waardoor 


een situatie als 


is toegestaan. Hoewel bij problemen waarvoor grafen gebruikt kun- 
nen worden dit inderdaad voorkomende situaties kunnen zijn, zullen 
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wij ons hier houden aan de eerder gegeven definities. De algoritmen 
zullen echter - zij het soms met kleine aanpassingen - ook gebruikt 
kunnen worden in gevallen waar bovenstaande situaties optreden. 
We moeten wel oppassen met de terminologie; deze is niet genormali- 
seerd. Auteurs verschillen nogal in de definities van de begrippen. 


Een graaf met gewichten (een gewogen, een 'gelabelde!', graaf) is 
een drietal (P,Z,W) waarin (P,Z) een graaf is en W een functie is 
van Z (of soms van P) in een andere verzameling. Als z€ Z dan 
wordt W(z) het gewicht van z genoemd. Als een graaf wordt gete- 
kend plaatst men de gewichten bij de betreffende zijden. 


Voorbeeld 
G = (P,Z,W) met 


00E, 
2,3),(2,4),(3,1),(3,6),(4,3),(6,4),(6,5),(7,6)} 


en 


Bijvoorbeeld: bij het eerder genoemde voorbeeld van de wegenkaart 
kunnen gewichten gebruikt worden om afstanden te representeren. 


De graad van een punt p in een ongerichte graaf, d(p), is het aan- 
tal zijden waarvan p eindpunt is. In een gerichte graaf is id(p) - de 
in-graad van p - het aantal gerichte zijden waarvan p eindpunt is 
en is od(p) - de uit-graad van p - het aantal gerichte zijden waar- 
van p beginpunt is. Voor de graad van een punt p in een gerichte 
graaf, d(p), geldt: d(p) = id(p) + od(p). 

Een punt p heet geïsoleerd als d(p) = 0. Een punt p met d(p) = 1 
wordt een eindpunt genoemd. 

Een reguliere graaf is een graaf waarvan alle punten dezelfde 
graad hebben. 
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Twee punten in een graaf zijn aanliggend (adjacent) als er een 
zijde is die beide punten verbindt. 


Een graaf zonder zijden (alle punten hebben graad 0) wordt een 
nulgraaf genoemd. Een graaf wordt volledig genoemd als elk tweetal 
punten van P verbonden is door een zijde. De volledige ongerichte 
graaf met n punten wordt wel aangegeven met Kn. Het aantal zijden 
van Kn is n(n-1). Een volledige ongerichte graaf is regulier met 
als graad van de punten n-1. 


K3: ee Kg: he, K4: 


Twee grafen G1 = (P1,Z1) en G2 = (P2,22) zijn isomorf als er een 
één-éénduidige afbeelding is van P1 op P2 die ook een één-ééndui- 
dige afbeelding van Z1 op Z2 inhoudt (het verbonden zijn van pun- 
ten blijft behouden). 


Voorbeeld 
1 j- 5 
2 4 6 
is isomorf met 
a b 
f c 
e d 


volgens de afbeelding: 
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Een subgraaf van een (gerichte) graaf G = (P,Zj) is een (gerichte) 
graaf G' = (P,Z2) met Z2 cZ1. 


Voorbeeld 


en 


zijn subgrafen van 


In een tweedelige ongerichte graaf G = (P,Z) is de puntenverzame- 
ling P de disjuncte vereniging van P1 en Pg en wel zodanig dat elke 
zijde van Z een punt uit Py verbindt met een punt uit P9. De twee- 
delige graaf wordt volledig genoemd als elk punt uit P1 is verbon- 
den met alle punten uit Ps (en omgekeerd). Als |Pjl =m en |Pgl =n 
wordt de volledige tweedelige graaf aangegeven met Km‚n- 


Km,n heeft m+n punten en m*n zijden. 


Een pad van v naar w in een (gerichte) graaf G = (P,Z) is een rij 
zijden (z1,22,...,Zn) zó dat elke zijde zi (1 < i <n) één punt 
gemeen heeft met zj-j en één met zj+j en dat de 'vrije' uiteinden 
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van zj en zn respectievelijk v en w zijn (begin- en eindpunt van 
het pad). De lengte van het pad is n (het aantal zijden in het pad). 
Een pad is enkelvoudig als geen enkel element van P (of van Z) 
meer dan één maal in de rij optreedt (eventueel afgezien van begin- 
en eindpunt). Een (enkelvoudig) pad is een (enkelvoudige) cykel 
als begin- en eindpunt samenvallen. 


Een graaf is samenhangend als voor elk tweetal punten v en w van 
de graaf er een pad is van v naar w. Een gerichte graaf is sterk 
samenhangend als er voor elk tweetal punten v en w een gericht pad 
is van v naar w. Een gerichte graaf G is zwak samenhangend als de 
ongerichte graaf G', die uit G ontstaat door alle richtingen van de 
zijden te ignoreren, samenhangend is. 


Een volledig pad (Euler-pad) is een pad waarin alle zijden van de 
graaf precies één keer voorkomen. 
Zo kunnen we ook spreken van een Euler-cykel. Bijvoorbeeld: 


det 


Een graaf met een Euler-pad wordt een Euler-graaf genoemd. Bij- 
voorbeeld : 


en 


zijn Euler-grafen. 
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Een resultaat uit de grafentheorie is het volgende. 


Een samenhangende ongerichte graaf is een Euler-graaf dan en 
slechts dan als er precies twee punten met oneven graad zijn of 
als alle punten een even graad hebben. In het laatste geval is 
ieder Euler-pad een Euler-cykel; in het eerste geval is er geen 
enkele Euler-cykel. 


Hieruit kunnen we concluderen dat een Köningsbergse wandeling 
niet bestaat: alle punten hebben oneven graad. 


Voorbeeld (zie hoofdstuk 2, voorbeeld 2) 


Er zijn 20 verschillende rijtjes nullen en enen ter lengte n. De 
vraag is een rij agaj ...ar,-1 van nullen en enen te maken zodanig 
dat er voor ieder rijtje w van n nullen en enen precies één index i 
is met ajai+1l ... Aitn-1 = W (indices cyclisch doortellen; er moet 
gelden L = 20). 


Heeft dit probleem een oplossing? 


We ‘vertalen! dit probleem naar een grafenprobleem. Daarbij gaan we 
we uit van de gerichte graaf G = (P,Z) met 


- P is de verzameling van alle 20-1 rijtjes ter lengte n-1; 

- Z is de verzameling van alle 2P rijtjes ter lengte n; 

- de zijde bjbg2...bn begint in punt bibg...bn-1 en eindigt in 
punt b2b3 ... bn. 


Bijvoorbeeld voor n = 4: 


Grafen 


Dan geldt: als deze graaf G een Euler-graaf is, is er dus een pad 
waarbij steeds de eerste van een viertal verwijderd wordt en een 

nieuwe als laatste (vierde) toegevoegd wordt, zó dat alle mogelijke 
viertallen tegengekomen worden, en heeft het oorspronkelijke pro- 


bleem een oplossing. 


Het resulterende probleem is dus te bepalen of de graaf een 
Euler-graaf is. (En dat is het geval: zie in de figuur de stippel- 


lijn.) 


Een cykel die elk punt van de graaf precies één keer passeert is 
een Hamilton-cykel. Als zo'n Hamilton-cykel bestaat heet de graaf 


een Hamilton-graaf. 


Bijvoorbeeld: 


zijn Hamilton-grafen. 


10.2 SPECIFICATIE EN DEFINITIE VAN DE 


Om algoritmen te ontwerpen die operaties en berekeningen op grafen 
uitvoeren is het nuttig de graafstructuur als datastructuur ter 
beschikking te hebben. Daartoe zullen we eerst de graafstructuur 


GRAAFSTRUCTUUR 


ontwerpen als abstracte datastructuur. 


De elementaire operaties op grafen die we, kijkend naar het 
voorafgaande, bij de structuur willen laten horen, zijn: 


creatie van de lege graaf (Emptygraph); 
het toevoegen van een punt (addNode); 
het toevoegen van een zijde (AddEdge); 
het bepalen van de verzameling punten (Nodes); 
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- het bepalen van de verzameling zijden (Edges); 

- het bepalen van de verzameling punten waarmee een bepaald punt 
direct verbonden is (adjac); 

- het verwijderen van een knoop tezamen met alle zijden die die 
knoop als eindpunt hebben (wodeout); 

- het verwijderen van een zijde (rdgeout). 


We zullen ons nu beperken tot ongerichte grafen. 

In 10.1 zagen we reeds het verband tussen een zijde en een 
binaire relatie tussen de punten die door de zijde verbonden worden. 
Om een zijde te karakteriseren zullen we dan ook gebruik maken van 
de (constructie)functie Rel, die voor een tweetal punten een zijde 
creëert. 

De specificatiemodule voor de graafstructuur: 


specification graphstructure; 
sorts Graph,Edge,Node, Set; 
functions 
Emptygraph > Graph 
AddNode(Graph,Node) > Graph 
AddEdge(Graph,Edge) > Graph 
Nodes(Graph) > Set (Node) 
Edges(Graph) > Set(Edge) 
Adjac(Graph,Node) > Set (Node) 
NodeOut (Graph,Node) > Graph 
EdgeOut (Graph,Edge) > Graph 
axioms for all g € Graph, i,j,k,l,v,w € Node let 
Nodes(Emptygraph) = empty Tabel 
Nodes(AddNode(g,v)) = insert (Nodes(g),v) 
Nodes(AddEdge(g,Rel(i,j))) = insert(insert(Nodes(g),i),j) 
Edges(Emptygraph) = empty 
Edges(AddNode(g,v)) = Edges(g) 
Edges(AddEdge(g,Rel(i,j))) = insert(Edges(g),Rel(i,j)) 
Adjac(Emptygraph,v) = empty 
Adjac(AddNode(g,w),v) = Adjac(g,v) 
Adjac(AddEdge(g,Rel(i,j)),v) = 
if v = i then insert(Adjac(g,v),j) 
B else if v = j then insert(Adjac(g,v), i) 
else Adjac(g,v) 
NodeOut (Emptygraph,v) = Emptygraph 
NodeOut (AddNode(g,w),v) = 
if v=w then NodeOut(g,v) else AddNode(NodeOut(g,v),w) 
Nodeout (AddEdge(g,Rel(i,j)),v) =- = 
if v=i or v=j then NodeOut(g,v) 
else AddEdge(NodeOut(g,v),Rel(i,j)) 
EdgeOut (Emptygraph,Rel(i,j)) = Emptygraph 
EdgeOut(AddNode(g,v),Rel(i,j)) = 
AddNode(EdgeOut(g,Rel(i,j)),v) 
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Edgeout (AddEdge(g,Rel(k,1)),Rel(i,j)) = 
if Rel(k,l) = Rel(i,j) 
then EdgeOut(g,Rel(i,j)) 
else AddEdge(EdgeOut(g,Rel(i,j)),Rel(k,1)) 


end; 


Uitgaande van deze specificatie kunnen we nu de graafstructuur 
gaan definiëren. 


definition graphstructure; 

structure Graph(type Node); 

type Edge; 

function Emptygraph: Graph(Node); 
{pre: true 
post: Emptygraph = (9,9) } 

procedure AddNode(var g: Graph(Node); n: Node); 
{pre: g = (P,Z) 
post: g = (P U {n},2)} 

procedure AddEdge(var g: Graph(Node); a,b: Node); 
pre: g = (P,Z) 
post: g = (P, U {fa,b}})} 

function Nodes(g: Graph(Node)): set(Node); 
[pre: g = (P,Z) 
post: Nodes(g) = P Ag = (P,Z)} 

function Edges(g: Graph(Node)): set (Edge); 
pre: g = (P,Z) 
post: Edges(g) =Z Ag = (P,Z)} 

function Adjac(g: Graph(Node); n: Node): set (Node); 
pre: g = (P,Z) 
post: g = (P,Z) A Adjac(g,n) = {x E P | {n,x} € z}} 

rocedure NodeOut(var g: Graph(Node); n: Node); 

{pre: g = (P,Z) 
post: g = (Pí{n}, Z{z € Z | n € z})} 

procedure EdgeOut(var g: Graph(Node); a,b: Node); 
{pre: g = (P,Z) A (a # b) 
post: g = (P,Z^N{a,b})} 


end; 
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10.3 ALGORITMEN OP GRAFEN 


De lengte van het kortste pad tussen twee punten 
Gegeven is een samenhangende gewogen graaf G = (P,Z,W) en twee 


punten a € P en b € P. Gevraagd wordt de lengte van het kortste 
pad (het gewicht van het pad met minimaal gewicht) tussen a en b. 


Voor een pad 


(Apoa: P1} {P1 P3} ee (Py-1°PK PD 


is het gewicht gedefinieerd als 


Voorbeeld 


De lengte van het kortste pad tussen A en H is 9. 


N.B. Voor een graaf zonder gewichten is het kortste pad het pad 
dat uit het minste aantal zijden bestaat (voor alle {x,y} € Z 


geldt W({x,y}) = 1). 


Natuurlijk is het mogelijk alle paden tussen a en b te genereren en 

het gewicht te bepalen. We zullen een efficiëntere oplossing geven. 
We gaan uit van een van de twee punten, zeg a, en gaan een weg 

zoeken naar b op een wijze die overbodige paden overslaat. De 


methode is als volgt. 
We beschouwen in graaf G twee subgrafen: 


G1 = (P1,Z1) met 


Grafen 


P1: de verzameling punten waarvoor het kortste pad naar a 
gevonden is; 


Z1: de zijden van deze kortste paden. 


G2 = (P2,22) met 


P2: de punten die buur zijn van punten in P1; 


Z2: voor ieder punt y € P2<P1 is er ten minste één pad van de 
vorm 


(Po 7a: P1} {P]P9)}, pE ,{Pk-1°Pk SYD 


met pj € P1 voor i= 0,1,...,k-1; 
Z2 bevat voor alle y € P2<P1 de zijde {pk-1,y} van het 
kortste pad van deze vorm. 


Voor het toevoegen van een punt d uit P2<P1 aan P1 is het niet vol- 
doende alleen naar de kortste zijde (met d als eindpunt) te kijken 
(zie voorbeeld! ). We moeten zoeken naar die zijde {c,d} € Z2 waar- 
voor g(a,e) + W({e,d}) minimaal is, met 


g(a,c) = het gewicht van het kortste pad tussen a en c. 


Dat we op deze manier het kortste pad tussen a en d vinden, en 
dus zodra b aan P1 is toegevoegd dat we klaar zijn, volgt uit de 
volgende stelling: 


STELLING: Als {c,d} met c € P1 end € P2<P1 zó wordt gekozen dat 
g(a,e) + W({e,d}) minimaal is, wordt het korste pad van a naar d 
gevonden door de zijde {c,d} aan te sluiten op het kortste pad van 
a naar c. 


BEWIJS: Stel dat er een korter pad is van a naar d. Dit pad kan 
niet via uitsluitend punten uit P1 (volgt uit de eigenschap voor Z2). 
Dus is er een x€ P2<P1 (of een heel pad waarvan punt x het eerste 
is dat niet in P1 ligt) in het kortere pad. Voor x geldt 


g(a,x) =g(a,y) + W{a,y}) 


met y € P1 (y is het laatste punt in P1 van het pad). 
Door de keuze van c en d geldt: 
g(a,e) + W(e,d}) < gla,y) + Wy,x}). 
Dus 


g(a naar d via c) < g(a naar d via y en x). 
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Voorbeelden 


Als 
A 2 B 
Ț ` 
/ Ns \ 
9 "i ES 4 
/ En \ 
/ G N 
/ y 
Fe °C 
met 
Pt {4AB} en “Pa ={AiB, FGC) 
Z1 = {{A,B}} en 22 ={{A,F},{A,G},{B,C}} 
geldt: 


g(A,B) + W({B,C}) 
g(A,A) + W({A,G}) 
g(A,A) + W({A,F}) 


H 
oO J oD 


en zal punt G naar P1 gaan. 


Als 
geldt: 
g(A,C) + W({C,D}) = 8 
g(A,A) + W(A,F}) =9 
g(A,G) + WEG,IJ) = 7 
g(A,G) + W({G,H}) = 10 
en zal punt I naar P1 gaan. Ae 


Als er een punt (zijde) uit G2 is toegevoegd aan G1 moeten P2 en Z2 
aangepast worden. Allereerst moet voor de punten in P2<P1 bekeken 
worden of er door de toevoeging van het punt aan P1 geen kortere 
paden van deze punten uit P2<P1 tot het punt a mogelijk zijn, met 
andere woorden de zijden {pk-1,y} voor alle y € P2NP1 moeten 
eventueel aangepast worden. Bovendien moet worden nagegaan of 
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nieuwe punten uit G over moeten gaan naar P2 omdat ze buren zijn 
van het zojuist aan P1 toegevoegde punt. Z2 moet om dezelfde reden 
aangepast worden. 


Voorbeeld 


Nadat I naar P1 is gegaan (zie voorbeeld vorige bladzijde) 


en {A,F} in Z2 moet vervangen worden door {I,F} 
(WAA,F}) > g(A,D) + WQI,F})). 9 


We gaan gebruiken een array D[Node] waarvoor geldt 


D[c] = g(a,c) voor c€ P1 
D[d] = g(a,c) + W({c,d}) voor d € P2<P1 en {c,d} € 22 
D[e] = maxint voor de andere punten. 


We nemen aan dat de functie W gegeven is in een array w[Node, Node], 
en we zullen als hulpvariabelen gebruiken 


var sn: set(Node); {samengestelde set} 

_____chulp: set(Node); {samengestelde set, hulpvariabele om 
het ‘andere! eindpunt van een zijde 
te bepalen} 
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- Glen G2 als hierboven vermeld, 
- x İs het laatst aan G1 toegevoegde punt, 
- D als hierboven vermeld. 


Het algoritme (van Dijkstra) wordt nu: 


G1 := Emptygraph; G2 := Emptygraph; 
= a; AddNode(Gl,x); AddNode(G2,x); D[x] := 
:= Adjac(G,x); 
ile not isempty(sn) do 
begin y := any(sn); “delete(sn, y); 
AddNode(G2,y); AddEdge(G2,x,y); D[y] := w[x,y] 


x 
sn 
hi 


end; 
{invariant} 
while x <> b do 
begin sn := = Nodes(G2); min := maxint; 
{inv.: min = (MINy : y € P2NP1N sn: D[y]) (= D[x] = g(a,c) + w[c, x])} 
while not isempty(sn) do 
begin | y := any(sn); “delete(sn,y); 
if not el(Nodes(G1),y) 
— then if D[y] < min then begin min := D[yl; 
chulp := Adjac(G2,y); 
c := any(chulp); 


XxX 
{c € Pi A {c,x} E€ 22} 


end 
end; 

{voor zijde {c‚x} uit Z2 is D[x] minimaal} 

AddNode(Gl,x); 

AddEdge(Gl,c,x); 


sn := Nodes(G2); 
{voor alle y € P2N P1 eventueel Z2 en D aanpassen: } 
while not isempty(sn) do 

begin y := any(sn); “delete(sn,y); 

if el(Adjac(G,x),y) and not el(Nodes(G1),y) 
then if D[x] + w[x,y] < D[y] 
then begin chulp := Adjac(G2,y); C := any(chulp); 
EdgeOut(G2,c,y); AddEdge(G2,x,y); 
D[y] := Dix] + w[x,y] 
end 

end; Be 
{eventueel toevoegen aan G2:} 
sn := Adjac(G,x); 
while not isempty(sn) do 

begin y := any(sn); delete({sn,y); 

if not el(Nodes(G2),y) 
then begin AddNode(G2,y); AddEdge(G2,x,y); 
Dlyl := D[x] + wlx,yl 
end 
end 
end; EEE 


{D[x] = g(a,b) } 
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We hebben de lengte van het kortste pad gevonden. Voor het pad 
zelf zouden we de punten van P1 moeten doorlopen. 


De kortste opspannende boom van een samenhangende graaf 


We gaan weer uit van een gegeven gewogen samenhangende graaf 
G = (P,Z,W). Een opspannende boom voor graaf G is een subgraaf 
die alle punten bevat en die een boom is (samenhangend, zonder 
eykels: vanuit elk punt is elk ander punt bereikbaar via één uniek 
pad). Het gewicht van een boom is de som van de gewichten van de 
zijden van de boom. 

Gevraagd: G' = (P',Z',W) met P' =P A Z'cZ, zó dat G' een 
opspannende boom is, met het gewicht (Si: zj € Z': W(zj)) minimaal 
voor alle opspannende bomen. Ze 


Voor een graaf kunnen verscheidene opspannende bomen bestaan. 
Bijvoorbeeld voor de graaf 


zijn opspannende bomen (met hun gewichten): 


7 3 gewicht: 23 


gewicht: 23 
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T gewicht: 26 


gewicht: 21 


We gaan uit van een willekeurig punt. We breiden de huidige sub- 
graaf steeds uit door als volgend punt aan de subgraaf toe te voe- 
gen: het punt, nog geen punt van de subgraaf, met de kortste 
verbinding (zijde met kleinste gewicht) met de subgraaf. 

Dit algoritme eindigt als alle punten van de graaf G zijn opgeno- 
men in de subgraaf. 


Deze aanpak (het algoritme van Prim), volgens de greedy methode, 
levert de oplossing voor dit probleem. Dit volgt uit de volgende 


STELLING: Stel dat Z1 (Z1 c Z) een deelverzameling is van de 
zijden van een minimale opspannende boom T van de graaf 
G = (P,Z,W). Stel dat P1 de verzameling punten is behorend bij Z1. 
Als {x,y} een zijde met minimaal gewicht is voor x € Plen y € P1, 
dan is Z1 U ({x,y}) een deelverzameling van de zijden van een mini- 
male opspannende boom T. 

(Iedere andere weg om y op te nemen in de minimale boom zal tot 
een groter gewicht leiden.) 


BEWIJS: Als {x,y} een zijde is van T dan is de stelling juist. Als 
{x,y} niet voorkomt in T, dan is er in T een pad van x naar y. 

Stel dat {v,w} de eerste zijde in dit pad is waarvoor geldt: v € P1 A 
w € P1; neem T'= Ts {{v,w}} U {{x,y}}. Dan Z1 U {{x,y}}c T'en 
T' is een opspannende boom. Er geldt: W({x,y}) < W({v,w}) en dus 
W(T') < W(T), dus T is geen minimale opspannende boom. Tegen- 
praak; dus: {x,y} E€ T. » 


We houden invariant: in G = (P,Z,W) beschouwen we twee subgra- 
fen: 
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G1 = (P1,Z1) met: 


P1: de verzameling punten in het reeds geconstrueerde deel van 
de boom; 

Z1: de verzameling zijden in dit reeds geconstrueerde deel van 
de boom. 


G2 = (P2,22) met: 


P2: de verzameling buurpunten van punten in P1; 
Z2: bevat voor iedere p € P2<P1 de zijde met eindpunt in P1 met 
minimaal gewicht. 


We nemen wederom aan dat de functie W gegeven is als een array 
w[Node,Node], en als hulpvariabelen gebruiken we: 


var sn: set(Node); {samengesteld} 
chulp: set(Node); {samengesteld, hulpvariabele om het 
‘andere! eindpunt van een zijde te 
bepalen} 


Nodes(G); x := any(sn); {willekeurig punt} 
G1 Emptygraph; AddNode(G1,x); 
G2 := Emptygraph; AddNode(G2,x); 
sn := Adjac(G,x); 
while not isempty(sn) do 

begin y := any(sn); delete(sn,y); 
AddNode(G2,y); AddEdge(G2,x,y) 


sn : 


end; 
{invariant} 
while Nodes(Gl) <> Nodes(G) do 
begin sn := Nodes(G2); min := maxint; 
{inv.: min = (MINi,j: i € P2NPiNsn a {i,j} € 22: wli,j}) 
= wW[x,v] voor {x,v} € Z2 en x € P2} 
while not isempty(sn) do 
begin y := any(sn); delete(sn,y); 
if not el(Nodes(G1),y) 
=r ghen begin chulp := Adjac(G2,y); C := any (chulp); 
if W[y,c] < min then begin min := Wly,cl; 
BRR ore yr Varg 
end 
end 
end; 
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{{x,v} is minimale zijde uit Z2} 
AddNode(Gl,x); AddEdge(Gl,x,v); 
{voor alle y € P2N P1 eventueel Z2 aanpassen: } 
sn := Nodes(G2); 
while not isempty(sn) do 
begin y := any(sn); delete(sn,y); 
if el(Adjac(G,x),y) and not el(Nodes(Gl),y) 
then begin chulp := Adjac(G2,y); c := any(chulp); 
if w[x,y] < wle,yl 
then begin Edgeout(G2,c,y); 
AddEdge(G2,x,y) 


end 
end aia 
end; 
{Eventueel toevoegen aan G2:} 
sn := Adjac(G,x); 
while not isempty(sn) do 
begin y := any(sn); delete(sn,y); 
if not el(Nodes(G2),y) 


then begin AddNode(G2,y); AddEdge(G2,x,y) end 
end 


end; 
{G1 is de gevraagde minimale opspannende boom} 


Dit algoritme is O(n?) - n is het aantal punten - bij een implementa- 
tie die uitgaat van de verzameling punten (bijvoorbeeld adjacency 
matrix, zie 10.4). Een implementatie die uitgaat van de verzameling 
zijden - m is het aantal zijden - zal een efficiëntie van O(m log m) 
opleveren voor het volgende algoritme voor dit probleem (algoritme 
van Kruskal). 

In het voorgaande algoritme is het deel van de opspannende 
boom, dat reeds geconstrueerd is, steeds een boom. In het volgende 
algoritme is dat niet het geval. Aan dit algoritme ligt de volgende 
stelling ten grondslag (die we niet zullen bewijzen). 


STELLING: Stel dat we een verzameling disjuncte bomen hebben die 
deel uitmaken van de minimale opspannende boom. Z1 is de verzame- 
ling van alle zijden van deze bomen; stel dat {v,w} een kortste zijde 
is uit ZĒ~ Z1, waarvoor geldt dat v en w niet in dezelfde boom voor- 
komen. Voor iedere kortste opspannende boom, waarin Z1 voorkomt, 
geldt dat ook {v,w} erin voorkomt. e 


We zullen steeds van de nog niet gekozen zijden die met het kleinste 
gewicht opnemen in de verzameling zijden die ten slotte de opspan- 
nende boom vormt (mits de gekozen zijde niet twee punten heeft die 
al in dezelfde deelboom zitten, want dan ontstaat een cykel). 


We houden invariant: 
Z1: de verzameling van zijden die tot de minimaal opspannende 


boom behoren; 
Z2: de nog niet bekeken elementen van Z; 
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V: het aantal elementen van V is het aantal deelbomen; elk ele- 
ment van V is de verzameling punten van de betreffende 
deelboom. 


var Z1,22: set(Edge); {samengesteld} 
V: set(set(Node)); {samengesteld (enkelvoudig) } 
p: set (Node); {samengesteld} 


empty(Z1); Z2 := Edges(G); 
empty (V); 
sn := Nodes(G); 
while not isempty(sn) do 
begin y := any(sn); delete(sn,y); 
empty(p); insert(p,y); insert(V‚p) 
end; 
iv = {{p} | p € P}} 
while card(V) > 1 do 
begin 'kies een kortste element z = {x,y} uit Z2'; 
delete(Z2,2); 
if 'x en y in verschillende elementen van V, zeg 
ERI ADE EARL EB! 
then begin delete(V,E1); delete(V,E2); 
insert(V‚,union(El,E2)); 
insert(Z1,2z) 


end 


end; 


De implementatie van Z2 moet zodanig zijn dat het kiezen van een 
kortste element efficiënt kan gebeuren. Voor V moet gelden dat 
efficiënt is na te gaan van welke verzameling een bepaald punt een 
element is. 


Het uitvoeren van een operatie voor alle punten (zijden) van een 
graaf 


In veel problemen die in termen van grafen geformuleerd kunnen 
worden, moet op alle punten of op alle zijden van de graaf een ope- 
ratie worden uitgevoerd. Er zijn twee bekende volgordes om een 
graaf te doorlopen: breadth-first en depth-first. 


Bij de depth-first volgorde starten we vanuit een bepaald punt en 
volgen de zijden van de graaf tot we niet verder kunnen (alle buren 
zijn al bezocht of er zijn geen andere zijden). We gaan dan terug 
naar het vorige punt en proberen van daaruit verder te gaan. 
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Voor de graaf 


A B 
LT 
E D 


is een depth-first volgorde beginnend bij punt A (aangegeven door 
de volgorde waarin zijden gekozen worden): 


Bij de breadth-first volgorde starten we ook vanuit een bepaald 
punt, daarna nemen we (in willekeurige volgorde) de punten met 
afstand 1 tot dat punt, dan de punten met afstand 2, etcetera. 


Een breadth-first volgorde voor bovenstaande graaf, beginnend bij 
punt A (aangegeven door de volgorde waarin zijden gekozen worden): 
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Bij beide methoden moeten we een lijst bijhouden van punten die al 
bezocht zijn. Bij depth-first zal deze lijst een stack zijn, bij breadth- 
first een queue. 

We geven beide algoritmen. Het startpunt is punt p. We gebrui- 
ken: 


var bezocht: array[Node] of boolean; 


om aan te geven of een punt al dan niet reeds bezocht is. Met P(x) 
geven we de operatie aan die op punt x moet worden uitgevoerd. 


Depth-first: 


var s: stack(Node); 
HE set (Node); 
begin sn := Nodes(G); 
while not isempty(sn) do 
begin y := any(sn); delete(sn,y); 
bezocht[y] := false 


end; 
p := ...; CreateS(s); 
bezocht[p] := true; P(p); Push(s,p); 
while not StackIsMT(s) do 
begin t := Top(s); 
while 'er is nog een niet-bezochte buur w van t- do 


begin bezocht[w] := true; P(w); Push(s,w); 
t := W 
end; 
Pop(s,t) 


end 
end 


Breadth-first: 


var q: queue(Node) ; 
sn: set(Node); 
begin sn := Nodes(G); 
while not isempty(sn) do 
begin y s= any(sn); delete(sn,y); 
bezocht[y] := false 


end; 
Pp := ...; Create0(g); 
bezocht[p] := true; P(p); PutQ(q,p); 
while not QIsMT(q) do 
begin GetQ(g,t); 
while ‘er is nog een niet-bezochte buur w van t* do 
begin bezocht[w] := true; P(w); PutQ(q,w) end 
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Voor beide volgordes geldt dat de operatie: ‘er is nog een niet- 
bezochte buur w van t' zo efficiënt mogelijk gerealiseerd moet wor- 
den. Dat zal afhangen van de implementatie van de graaf. De imple- 
mentaties met behulp van adjacency-matrix of adjacency-lists leve- 
ren een goede efficiëntie op (zie 10.4). 


Opmerking 


Met het in depth-first volgorde doorlopen van een graaf kunnen we 
ook een opspannende boom vinden. d 


Tot nu toe hebben we alleen gekeken naar ongerichte grafen. Voor 
gerichte grafen zal zowel de definitie (10.2) als de implementatie 
(10.4) aangepast moeten worden. Bij het doorlopen van alle punten 
van een graaf zal er in de algoritmen wat moeten veranderen. Als 
we bijvoorbeeld nemen als graaf 


A B 


C D 


en A als startpunt nemen, zal toch ook D aan de beurt moeten komen. 
We kunnen dus niet volstaan met één startpunt, maar moeten starten 
met een verzameling startpunten en wel alle punten die geen inko- 
mende pijlen hebben. Deze verzameling moet bij depth-first initieel 
op de stack geplaatst worden. 

Als voorbeeld behandelen we de topological sort. Gegeven een 
gerichte graaf waarvan de pijlen een partiële ordening represente- 
ren. Dat wil zeggen dat: 


als er een pijl van x naar y loopt, is x< y. 


Gevraagd wordt de punten van de graaf een zodanig rangnummer te 
geven dat geldt: 


rang; < rang; ei<j. 


Voorbeeld 


Stel dat de graaf uit 10 punten bestaat, waarop de volgende orde- 
ning is gedefinieerd: 


Grafen 


A B J 
C I 
G 


Dan zijn de mogelijke rangorden: 


Aso Bled Del, GEH 
GL, ASB FCE, H,J 


Dit is te realiseren omdat de graaf geen cykels bevat. 

De graaf wordt in depth-first volgorde doorlopen, met als start- 
punten de punten zonder voorgangers (in het voorbeeld A en G). 
Vanuit zo'n startpunt wordt de graaf doorlopen tot aan een punt 
van waaruit geen verdere weg mogelijk is. Dit laatste punt moet in 
de rangorde een nummer hebben dat groter is dan de rangnummers 
van alle punten die ‘onderweg! gepasseerd zijn én de vanuit deze 
punten bereikbare punten. Dit is te realiseren door elk punt in de 
depth-first volgorde een rangnummer te geven dat één kleiner is 
dan zijn voorganger. Als eerste rangnummer wordt n (het aantal 
punten) gegeven. 


Stel dat het aantal punten van de graaf is gegeven (n), en dat de 
graaf zelf gegeven is in 


var F: sequence({record x,y: integer end); 


(x,y) > x < y} 
We gebruiken: 


var G: arrayll..nl of sequence(1..n); 


voor de representatie van de graaf en de ordeningsrelatie, en 


var Ri arrayl1i..n] of 1..n; 


voor de rangnummers, Bovendien 


var startpunt: array[1..n] of boolean; 
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voor het vastleggen van de startpunten (geen voorgangers). 

We moeten hier de operatie die op een punt p moet worden toege- 
past (hier: rangnummer toekennen) pas uitvoeren als op alle punten 
die vanuit p bereikbaar zijn de operatie reeds is toegepast. Vandaar 
dat deze operatie nu op een andere plaats in het algoritme terecht- 
komt. 

Het programma: 


for i :=1 to n do begin CreateSeq(Gli]); startpunt[i] := true end; 
while not SeqIsMT(F) do 

begin in GetFirst(F‚p); edna dd a x],p.-y); 

startpunt[p.y] := false 

end; 
i is:=1ton do bezocht[i] := false; 
rang := n; 
for i := 1 to n do 

“begin if if startpunt[i] 

then begin bezocht[i] := true; 
CreateS(s); Push(s,i); 
while not StackIsMT(s) do 
“begin while in while not SeqIsMT(G[Top(s)]) do 
begin in GetFirst(cltop(s)],y); 
if not bezocht ly] 
then begin bezocht{[y] := true; 
Push(s‚y) 
end 
end; 
Pop(s,‚x); R[x] := rang; 
rang := rang ~= 1 
end 
eads i ri 
end 


Warshall's Algoritme 


In dit voorbeeld wordt een grafenprobleem behandeld waarbij we 
niet echt operaties op grafen uitvoeren, maar waar we direct opere- 
rend op de representatie een efficiënte oplossing zoeken. De vorm 
van representatie zal in 10.4 terugkomen. 

Warshall's algoritme bepaalt de transitieve afsluiting R* van een 
binaire relatie R, dat wil zeggen als geldt aRb en bRc, dan geldt 
aRtc en er wordt gevraagd R* te bepalen als R gegeven is. 

De relatie kunnen we weergeven met een gerichte graaf. Als bij- 
voorbeeld geldt: 


- de verzameling punten is {1,2,3,4} 
- R: 1R3, 2R4, 3R2, 4R1, 4R2, 4R3 


dan hoort hier als graaf bij: 


Grafen 


In termen van grafen luidt de definitie van de transitieve afsluiting: 
De transitieve afsluiting van een gerichte graaf G = (P,Z) is een 
gerichte graaf G' = (P,Z'), zodanig dat (a,b) €Z' als er een pad 
is van a€ P naar b € P inG. 


Voor de bovenstaande graaf is de transitieve afsluiting: 


En: 8 


(afgezien van verbindingen van punten met zichzelf). 
Gegeven is de relatie over n punten in de vorm van 


var m: arrayl 1..n,l..nl of boolean; 
{m[i,3] = 'iRj' = 'in de graaf loopt een pijl van i naar j'} 


Gevraagd wordt 


var t: arrayll..n,l..nl of boolean; 
een zodanige waarde te geven dat geldt 
Re tii Sa LERS jte tinde graaf loopt een pad vän i: naar j*} 


Voor bovenstaand voorbeeld geldt: 
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m: TE A ae 
Sh tE. 
BEN ne 
EEE EN 
en moet gaan gelden: 
t: EE RE ERE 
kn nee OR 
Kr ie ACER 
o ORE 


Een eerste oplossing (recht-toe-recht-aan) vinden we door de paden 
in volgorde van toenemende lengte te bekijken. 
We nemen als invariant: 


P: t[i,j] = ter is een pad ter lengte & l van i naar j' 


en zien dat geldt: P A 1 = n > R. Initialisatie (1 := 1 {P}) is triviaal. 
Echter, het verhogen van de waarde van l met 1 is nogal wat 
werk: 
Voor alle punten i,j, k geldt: 


ter is een pad ter lengte < 1l van i naar k' 
A ‘er is een pijl van k naar j' 
> 'er is een pad ter lengte < l van i naar j' 


Het verhogen van l met 1 is dus een procedé met efficiëntie O(n®); 
R realiseren vergt dus O(n*). 


tse mp lee Ap pee mp {Pp Ap = ml} 
while 1 <> n do 


begin for i := IRO D de 
forj := 1 to n do 
begin v := false; 
for k := 1 ton do v:=v or (pli,k] andmlk, jl); 
h[i, jl oFV 
end; {h = ml+1} 
Tor i := 1,to n do 


= for j := 1 ton do 
begin pli,jl := hli,jl; 
ltd re tfi, 3i or glt, nl 
end; {p = miti A (t = m v m? v l, V ml+1)} 
l := 141 
end {(t =m vm v ss v mh) => R} 


Grafen 


De efficiëntie willen we verbeteren door een andere invariant te 
kie zen: 


P: t[i,j] = 'er is een pad van i naar j waarvan de interne 
punten allemaal element zijn van {1..k}' 


waarbij de interne punten van een pad alle punten op het pad zijn 
met uitzondering van het eerste en het laatste punt. 
Er geldt: P Ak = n > R. Initialisatie: t := m, k := 0 {P}. 


Het verhogen van de waarde van k met 1 kan als we gebruiken: 


ter is een pad van i naar k met interne punten < k' 
A ‘er is een pad van k naar j met interne punten < k' 
> 'er is een pad van i naar j met interne punten < k' 


We hebben nu geen hulparray nodig, en het programma wordt: 


k te Opt := m} 
while k <> n do 
begin k := k+l; 
Io: i e T ipo do 
for j:=1 ton do tli,jl :=tli,jl or (tli,kl and tlk,‚ jl) 
end 


ofwel 


K ra:0; t 2:2 M; 
while k <> n do 
begin k := k+1; 
for Zee 1 ton do 
if tli,k] then for j := 1 ton do tli,jl := 
tlijjd or tlk‚jJ 


end 


Het aldus verkregen programma heeft een efficiëntie van O(n*®). 

In dit programma wordt de or-operatie uitgevoerd op alle over- 
eenkomstige elementen in de rijen i en k (in de binnenste repetitie). 
Bij sommige implementaties (op vele machines) kan dat als or-opera- 
ties op machinewoorden worden gerealiseerd, hetgeen de efficiëntie 
erg ten goede komt. Mede daardoor is Warshall's Algoritme bekend 
als een efficiënt programma. 

In Pascal-termen kunnen we dat ook tot uitdrukking brengen 
door de relatie (graaf) te representeren in 


var s: arrayl1..nl of set(1..n); 
{j € s[i] & 'er is een pijl van i naar j'} 


Elke rij uit m is nu een verzameling in s. 
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Als we als invariant kiezen: 


j € s[i] e 'er is een pad van i naar j met alle interne 
knopen < k' 


wordt het programma: 


k's= 03 
while k <> n do 
begin k := ktl} 
for i s=tsto ndo 
KWR € s[i] then s[i] := union(slil,sl[k]) 


end 


Dit programma oogt als O(n?). Echter: de karakteristieke operatie 
is union, en het zal zeer van de implementatie van het set-type 
afhangen hoe de werkelijke efficiëntie is. Duidelijk is: W(n) = O(n?) 
en best-case O(n?). 


10.4 IMPLEMENTATIE VAN DE GRAAFSTRUCTUUR 


In deze paragraaf zullen we, uitgaande van de definitie van de 
graafstructuur in paragraaf 10.2, een aantal mogelijke implementa- 
ties bekijken. Daarbij zal steeds van belang zijn: 


— type Edge, 
— structure Graph (Node), 


- function Rel(a,b: Node): Edge; 
{pre: true 
post:.Rel(a,b) =-{a,b}}, 


- en de abstractiefunctie (met daarbij een eventuele representatie- 
invariant). 


Steeds zullen we als voorbeeld de representatie geven van de graaf 
GR = (PU,ZY) 


Grafen 


a. VERZAMELINGEN 


Uitgaande van de definitie in 10.1 ligt het voor de hand om voor een 
graaf G = (P,Z), met P en Z beide verzamelingen en Z een verzame- 
ling van verzamelingen, als implementatie te kiezen: 


type Edge = set (Node); 
structure Graph(Node) = record P: set (Node); 
e Z: set(Edge) 


end; 
function Rel(a,b: Node): Edge; 
var S: Edge; 
begin empty(s); insert(s,a); insert(s,b); 
Rel := s 
end; 
{Abstractiefunctie: voor g van het type Graph (Node): 
Alg) = (P,2) 
representatie-invariant: (Az: z € Z: |z| = 2)} 


De operaties van de graafstructuur zijn nu alle zeer eenvoudig te 
realiseren met behulp van de set-operaties. De efficiëntie zal geheel 
afhangen van de efficiëntie van de set-operaties. Deze implementatie 
staat een willekeurig aantal punten en zijden toe. 


Voorbeeld 
GR = (PU,ZY) met 


PU ={0,1,2,3,4} 
ZY = {0,1},{0,3},{0,4},{1,2},{1,4},{2,3},{3,4}} ° 


b. MATRIX VAN AANGRENZENDE PUNTEN (adjacency matrix) 


Een graaf G = (P,Z) met |P| = n kan worden gerepresenteerd als 
een n * n matrix A = (ajj), O<si<n ^0 <j<n, met de eigenschap 
dat aij = 1 (of true) als {i,j} € Z en aij = 0 (of false) als {i,j} ¢ Z. 
Deze matrix zal symmetrisch zijn voor een ongerichte graaf. Deze 
implementatie is alleen geschikt voor grafen van een vaste grootte 
(zie opmerking 1 op de volgende bladzijde). 

Als representatie van een edge ten behoeve van de constructor 
Rel zullen we in deze en volgende implementaties een record gebrui- 
ken. 


type Edge = record a,b: Node end; 
structure Graph(Node) = arraylNode,Nodel of 0..1; 
function Rel(s,t: Node): Edge; SP 

var e: Edge; 

begin e.a := S; eb := t; Rel := e end; 
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{Abstractiefunctie: voor g van het type Graph (Node): 

Alg) = (Node,{{i,j} | i € Node A j € Node n gli,jl = 1}) 
(er wordt geëist dat type Node een interval-type is) 
Representatie-invariant: de matrix is symmetrisch} 


Er zal gelden dat voor een punt p € Node de graad d(p) gelijk is 
aan de kolomsom(p) (= rijsom(p)). 

Als |Z| =m met m << n dan zal de representatie een ijle matrix 
zijn: wellicht is dan een andere implementatie te prefereren die min- 
der geheugenruimte vraagt. 

Deze implementatie is statisch in het aantal punten (er is een 
bovengrens) en dynamisch in het aantal zijden. 


Voorbeeld 
GR = (PU,ZY): 


Opmerking 1 


Deze implementatie is geschikt voor grafen van een vaste grootte 
wat het aantal punten betreft, dus waarbij operaties als 

AddNode en Nodeout niet gebruikt worden. De functie Emptygraph 
zal vervangen moeten worden door Creategraph die de matrix voor 
n punten initialiseert, 

Als we weten dat |P| < n zijn deze operaties wel toegestaan zoals 
gedefinieerd. We moeten in de structuurdefinitie dan de constante n 
(als parameter) opnemen, en in bijvoorbeeld addvode aan de pre- 
conditie toevoegen: |P| <n. 


Opmerking 2 


Bij gewogen grafen, waarbij het gewicht van een zijde een waarde is 
van het type w, zal het type Edge zijn: 


type Edge = record a,b: Node; w: W end; 


en ajj f 0 zal betekenen dat de zijde {i,j} bestaat en een gewicht aij 
heeft. 


Grafen 


Opmerking 3 


De matrix geeft aan of twee punten verbonden zijn. Geven we de 
matrix aan met A, dan geeft A * A = A? aan of twee punten in een 
of twee stappen vanuit elkaar bereikbaar zijn. Evenzo geeft A? aan 
of twee punten in ten hoogste 3 stappen vanuit elkaar bereikbaar 
zijn, enzovoort. ® 


Deze matrixrepresentatie is vooral van nut als vaak bepaald moet 
worden of er een verbinding is tussen twee punten. Als er operaties 
moeten worden uitgevoerd op alle zijden dan zijn dat rij- (of kolom-) 
operaties, waarbij in het geval dat m << n veel inspecties om niet 
gebeuren. De volgende implementatie representeert alleen de werke- 
lijk aanwezige zijden. 


c. LIJSTEN VAN AANGRENZENDE PUNTEN (adjacency lists) 


In deze implementatie wordt een afbeelding gemaakt van de punten 
op lijsten van buren. Een zijde wordt dus niet als zodanig gerepre- 
senteerd; als {a,b} een zijde is zal b voorkomen in de lijst van a en 
a in de lijst van b. Als we gebruiken 


type Edge = record a,b: Node end; 
function Rel(s,t: Node): Edge; 
var e: Edge; 
begin ea $s Ss; eb s:= t? Rel = e end; 


zal een operatie als addEdge zowel Rel.a in de lijst van Rel.b moeten 
opnemen als omgekeerd. 


c.1. Statisch aantal punten 


Als het aantal punten vast is (het aantal zijden mag variëren) kun- 
nen we de graafstructuur als een array van lijsten representeren. 
De lijsten kunnen sequences of kettingen zijn. 


structure Graph(Node) = arraylNodel of sequence(Node); 
labstractiefunctie: als g van het type Graph(Node) is geldt: 
Alg) = (Node,{{i,35} | j in de sequence gli} }) 
Representatie-invariant: (i in g[j]) = (j in glil); 
eventueel: (Ai: i € Node: glil gesorteerd) } 


Voorbeeld 
UR SS (PU: ZY): 


Bik) 

FE: €0,2,4) 

haten) 

Sea EL PEP 

4 CDE) e 
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structure Graph(Node) = arraylNodel of *punt; 
type punt = record buur: Node; 
next: fpunt 


end; 
{Abstractiefunctie en representatie-invariant als bij 
sequences } 
Voorbeeld 


GR = (PU,ZY) 


Do 
- 
D 
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c.2. Dynamisch aantal punten 


Als het aantal punten variabel is (evenals het aantal zijden) kunnen 
we de graafstructuur als lijst van lijsten representeren. Bijvoor- 
beeld: 


structure Graph(Node) = sequence(record p: Node; 
b: sequence (Node) 


end); 
{Abstractiefunctie: voor g van het type Graph (Node) : 
Atg) = {X | (Es: s in sequence g: s.p = x)} 
ALETI S | (Bs: S in sequence g: spe l 


A j in sequence s.b)}) 
Representatie-invariant: 
— ‘symmetrisch! 
- eventueel: . de sequence g is geordend op puntnummer; 
. de sequences b zijn geordend} 


Voorbeeld 
GR = (PU,ZY): 


Grafen 


((0,(1,3,4)) 
‚(1,(0,2,4)) 
‚(2,(1,3)) 
‚(3,(0,2,4)) 
‚(4,(0,1,3))) 


Zoals eerder aangegeven: deze implementaties met lijsten van buren 
zijn alleen zinvol als |Z| << |P|; anders is de implementatie met de 
adjacency matrix te prefereren omdat daar de inspectie op het buur- 
zijn een simpele operatie is. 


d. MATRIX VAN VERBINDINGEN (incidence matrix) 


Tot nu toe zagen we implementaties waarbij we steeds van P uitgin- 
gen. In deze en in de volgende vorm gaan we uit van Z. 

De graaf G = (P,Z) met |P| =n en |Z| = m kan gerepresenteerd 
worden door de n * m matrix A = (ajj) waarbij aij = 1 als punt pi 
eindpunt is van zijde zj, en ajj = 0 als punt pi niet eindpunt is van 
Zj. Voor deze matrix A zal gelden: 


- elke kolom heeft precies twee enen; 

- alle kolommen zijn verschillend; 

~ dp = (5j: 1j <m: ajj) (= de rijsom); 

- het aantal elementen is n *m, waarvan (n-2) * m elementen de 
waarde nul hebben. 


In deze implementatie zullen zowel P als Z parameter zijn van de te 
realiseren graafstructuur. 


type Edge = record a,b: Node end; 
structure Graph(Node,2) = array[Node, Z] a, A e hn E | 
function Rel(s,t: Node): Edge; aS 

var e: Edge; 


begin e.a := S; e.b := t; Rel := e end; 
{Abstractiefunctie: voor g van het type Graph{(Node,Z): 
A(g) = (Node,Z) 
Representatie-invariant: (Ai,j: i € Node A j EZ: 
gli,jl = 1 i is eindpunt van j)} 


Voorbeeld 
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Deze implementatie is statisch in het aantal punten en in het aantal 
zijden. 
Operaties als: 


- bepaal de eindpunten van een gegeven zijde, 
- bepaal van welke zijden een gegeven punt eindpunt is 


zijn nu eenvoudig te realiseren. 


e. LIJST VAN VERBINDINGEN 


Wederom uitgaande van de verzameling zijden kunnen we de graaf 
representeren met een opsomming van de zijden. Deze opsomming 
zal per zijde aangeven welke de twee eindpunten zijn. Ook hier zal 
de verzameling zijden Z parameter zijn van de graafstructuur. De 
lijst kunnen we met een array of met een sequence (of ketting) 
representeren. 


type Edge = record a,b: Node end; 
structure Graph(Node,Z) = array[Zz] of Edge; 
{Abstractiefunctie: voor g van het type Graph (Node,2) : 
Alg) = (Node,2) 

Representatie-invariant: triviaal} 


Deze representatie is statisch in het aantal zijden en vanzelfspre- 
kend ook in het aantal punten. 

Een representatie die dynamisch in het aantal zijden is, is die 
met behulp van een sequence (of een ketting). 


structure Graph(Node,2) = sequence(Edge); 
{Abstractiefunctie en representatie-invariant analoog} 


Deze vorm van implementatie leent zich alleen voor operaties die 
betrekking hebben op zijden. Voor operaties die met punten mani- 
puleren zal de efficiëntie erg slecht zijn. 


Grafen 


AFSLUITING 


We hebben een aantal verschillende mogelijkheden bekeken voor de 
representatie van een graaf. Welke representatie gekozen wordt zal 
afhangen van de operaties die veel gebruikt worden. Deze operaties 
bepalen of een dynamische structuur nodig is of dat met een stati- 
sche structuur volstaan kan worden. Tevens moet ervoor gezorgd 
worden dat de veel-gebruikte operaties zo efficiënt mogelijk gerea- 
liseerd kunnen worden. 


10.5 OPGAVEN 


1. Implementeer de graafstructuur, zoals gedefinieerd in 10.2, met 
behulp van (zie 10.4): 


verzamelingen ; 
adjacency matrix; 
adjacency lists; 

. incidence matrix; 

lijst van verbindingen. 


Me Me Renk: 


2. Geef het depth-first en het breadth-first algoritme voor het 
vinden van een opspannende boom voor een ongerichte graaf. 


3. Schrijf een programma dat bepaalt of een ongerichte graaf samen- 
hangend is. 
Eveneens voor een gerichte graaf. 


4, Een kliek C is een verzameling punten van een graaf G die vol- 
doet aan: 


i) elk punt in C is verbonden met elk ander punt in C; 
ii) er is geen ander punt in G dat aan C kan worden toegevoegd 
zonder i) te schenden. 


Schrijf een programma dat alle klieken van een gegeven graaf 
bepaalt. 


5. Het algoritme voor het vinden van de lengte van het kortste pad 
tussen twee gegeven punten kan aangepast worden voor het 
vinden van de lengtes van alle kortste paden van een gegeven 
punt naar alle andere punten van de graaf. 

Geef dit algoritme. 
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